如何进行语音合成?

问题描述

有一个项目需求,需要根据情况播放通知,但又不完全是文本朗读,需要将现有的录好音的部分和部分动态的内容进行组合,然后输出,比如:前往XXX的旅客请注意,您乘坐的XXXX次班车现在开始检票,请携带好随声行李物品到XXX号检票口排队检票上车,谢谢!其中,XXX部分是临时取出来的,其它汉字部分是录音录好的(完全电脑朗读让人受不了),这种方式用什么方法实现比较好,网上基本都是推荐使用微软的SpeechApplicationSDK,但不知道如何将已经录制好的内容和动态生成的合成一个语音文件,然后播放出来。

解决方案

本帖最后由 gatr 于 2014-04-13 11:30:51 编辑
解决方案二:
那更简单了,直接连续播放这几个音频就可以了。注意用音频编辑软件裁剪好音频开头结束的空白。
解决方案三:
引用楼主gatr的回复:

有一个项目需求,需要根据情况播放通知,但又不完全是文本朗读,需要将现有的录好音的部分和部分动态的内容进行组合,然后输出,比如:前往XXX的旅客请注意,您乘坐的XXXX次班车现在开始检票,请携带好随声行李物品到XXX号检票口排队检票上车,谢谢!其中,XXX部分是临时取出来的,其它汉字部分是录音录好的(完全电脑朗读让人受不了),这种方式用什么方法实现比较好,网上基本都是推荐使用微软的SpeechApplicationSDK,但不知道如何将已经录制好的内容和动态生成的合成一个语音文件,然后播放出来。

SpeechSDK还可以拉,你不能用MS的语音包,要用第三方的语音包,就能说的很标准的。这个Neospeech语音库就非常好
解决方案四:
引用1楼devmiao的回复:

那更简单了,直接连续播放这几个音频就可以了。注意用音频编辑软件裁剪好音频开头结束的空白。

显然不能使用编辑软件,而是自动组合出来,因为内容是临时取出的,要自动组合并播放出来
解决方案五:
也遇到过类似情况,我觉得可以这样,姓名部分用speech转成wav文件,然后用播放控件将姓名部分和固定音频文件按顺序播放
解决方案六:
引用3楼gatr的回复:

Quote: 引用1楼devmiao的回复:
那更简单了,直接连续播放这几个音频就可以了。注意用音频编辑软件裁剪好音频开头结束的空白。

显然不能使用编辑软件,而是自动组合出来,因为内容是临时取出的,要自动组合并播放出来

我是说,用编辑软件将空白裁剪掉,这样放起来更自然。你理解错我说的意思了。
解决方案七:
引用5楼devmiao的回复:

Quote: 引用3楼gatr的回复:
Quote: 引用1楼devmiao的回复:
那更简单了,直接连续播放这几个音频就可以了。注意用音频编辑软件裁剪好音频开头结束的空白。

显然不能使用编辑软件,而是自动组合出来,因为内容是临时取出的,要自动组合并播放出来

我是说,用编辑软件将空白裁剪掉,这样放起来更自然。你理解错我说的意思了。

原来如此,理解错误,见谅,该方法貌似可行
解决方案八:
做个播放顺序表,应该不难实现把,然后自动播放。现在音乐播放器许多播放歌单,类似的原则啊。
解决方案九:
百度TTS语音合成
解决方案十:
科大讯飞语音助手
解决方案十一:
引用楼主gatr的回复:

有一个项目需求,需要根据情况播放通知,但又不完全是文本朗读,需要将现有的录好音的部分和部分动态的内容进行组合,然后输出,比如:前往XXX的旅客请注意,您乘坐的XXXX次班车现在开始检票,请携带好随声行李物品到XXX号检票口排队检票上车,谢谢!其中,XXX部分是临时取出来的,其它汉字部分是录音录好的(完全电脑朗读让人受不了),这种方式用什么方法实现比较好,网上基本都是推荐使用微软的SpeechApplicationSDK,但不知道如何将已经录制好的内容和动态生成的合成一个语音文件,然后播放出来。

这是分成几段播的吧...播个"前往",然后播个"XXX",再播个"的旅客请注意....."不是合并成一个文件再播的吧?每次查找下要动态改变的部分该播哪个文件呗这些其实可以都录好,像公交报站一样.如果要现场做文字转语音的话,玩过能说会道,好像就是楼上说的tts做的.或者去utau或vocaloid相关社区看看有没有合适的合成工具啊音源啊接口啊之类的
解决方案十二:
这个解决了吗?现在做这一块的公司很多,像讯飞,百度都可以,jar包也都是曼菲使用的,http://blog.csdn.net/sz0268/article/details/51695426这个就是基于讯飞的语音合成,里面有代码实现,可以参考

时间: 2024-08-30 14:59:49

如何进行语音合成?的相关文章

INTERSPEECH 2017系列 | 语音合成技术

1.2 语音合成的应用场景和研究范围 语音合成技术是人与计算机语音交互中必不可少的模块.从地图导航(例如高德地图高晓松语音导航),语音助手(Apple Siri, Google Assistant,微软 Cortana, Nuance Nina), 小说.新闻朗读(书旗.百度小说), 智能音箱(Amazon Alexa, 天猫精灵, Google Home,Apple Pod Home 等 ),语音实时翻译,到各种大大小小的客服,呼叫中心,甚至机场广播,地铁公交车报站都少不了语音合成技术的身影.

从录音中提取语音特征,再去做个性化语音合成

问题描述 从录音中提取语音特征,再去做个性化语音合成 诸位 语音分析处理等相关领域的高人, 小民实在有事相求, 现在只能广发此求助信,希望能得到些许帮助.!2016年1月3日我们用笔记本拍的唯一一次全家福 现在我手上只有若干个语音文件(wav), 我老婆生前留下来的, 简单的来说, 就是想要三岁的孩子,以后还能听到妈妈的声音, 孩子叫妈妈, 妈妈会答应一声, 再奢望一点,就是孩子能和妈妈 能简单的对话, 让孩子感觉到 妈妈还在他身边. 我有很多种空想和假设,但是实现起来,却是如此的困难, 翻遍互

关于XML在语音合成中的应用

    互联网以及和它相关的一切现在似乎随处可见.您也许已经试过接到夜间电话推销员的语音电话.又或者曾经接到过当地药店给您的处方通知.现在,有一种新技术可以使用语音合成结合XML技术传送语音信息了.     以语音传递信息的手段并不是什么新东西.它是我们几千年来一直使用的交流方法.而且,从一台计算机那里接收到电话也并非什么新发明.许多语音技术到现在已经大行其道了,从传真机.自动拨号器到集成语音回复系统(IVR).电话当然是它最普遍的应用.     传统的语音系统使用预先录制好的样本.词典和音素来

XML在语音合成中的应用

xml|语音     互联网以及和它相关的一切现在似乎随处可见.您也许已经试过接到夜间电话推销员的语音电话.又或者曾经接到过当地药店给您的处方通知.现在,有一种新技术可以使用语音合成结合XML技术传送语音信息了.     以语音传递信息的手段并不是什么新东西.它是我们几千年来一直使用的交流方法.而且,从一台计算机那里接收到电话也并非什么新发明.许多语音技术到现在已经大行其道了,从传真机.自动拨号器到集成语音回复系统(IVR).电话当然是它最普遍的应用.     传统的语音系统使用预先录制好的样本

在ASP.NET程序中实现语音合成

asp.net|程序     你可能已经注意到,如今语音合成越来越普遍.成百上午的电动玩具和小器具都能够以机器的声音向它们的主人讲话.不管它是一个讲话的婴儿玩偶,一个会谈话的计步器或是一新的自动电话系统,现在几乎每天都会有一种使用文本来发音的产品发行. 文本-到-语音(TTS)技术,也称为语音合成,是把输入的文本转换成音频语音的过程.这种方式会优于预先录制好的文本-它必须对要说的内容提前了解.而使用TTS,却有可能加入动态的信息,该动态的信息可以来自于一个数据库:或是用户不断重复的话. 一. T

C#中调用SAPI实现语音合成的2种方法

  这篇文章主要介绍了C#中调用SAPI实现语音合成的2种方法,本文直接给出示例代码,需要的朋友可以参考下 我们都知道现在的语音合成TTS是可以通过微软的SAPI实现的,好处我就不多说了,方便而已,因为在微软的操作系统里面就自带了这个玩意,主要的方式有两种: 1.使用COM组件技术,不管是C++,C#,Delphi都能玩的转,开发出来的东西在XP和WIN7都能跑.(要引入SpeechLib,好像在项目上点引用,然后选到系统COM吧,好久没弄,记不清楚了) 2.使用WIN7的windows api

语音合成在语音助手中的应用及扩展

语音合成作为人机交互中必不可少的一个环节,随着计算机的运算和存储能力的迅猛发展,语音合成技术由早期的基于规则的参数合成,到基于小样本的拼接调整合成,并逐渐发展为现在比较流行的基于大语料库的拼接合成.与此同时,合成语音的自然度和音质都得到了明显的改善,在一定程度上达到了人们的应用需求,从而促进了其在实际系统中的应用.目前,语音合成技术已经在自动应答呼叫中心(包括金融.电信和政府等).电话信息查询(包括天气.交通和旅游等).汽车导航以及电子邮件阅读等方面得到广泛的应用,同时针对娱乐和教育方面的应用也

关于java中文语音合成的问题。

问题描述 关于java中文语音合成的问题. 本人要用java实现语音播报,但是找不到java的语音合成包.现跪求各位大神给一些建议. 解决方案 java默认能播放一些midi文件,这样的代码很好找,都是老代码了,要是想播放flc,或者MP3,或其他8和旋以上的文件,你搜搜gameframework,好像是oracle出的. 解决方案二: 我是想输入一个中文字符串,然后把这个字符串翻译成语音输出.但是找不到语音包.

tts-求助:vc编写语音合成程序,在调用语音库时,遇到的问题

问题描述 求助:vc编写语音合成程序,在调用语音库时,遇到的问题 求助各位大神: 本人最近学习通过vc调用MS Speech SDK的方式实现语音合成的方法.其中,语音库使用的是"ScanSoft_MeiLing_ChineseMandarinVoice".程序运行正常,语音正常. 可是在程序连续正常运行7-8天之后,突然就没有语音了. 尝试了各种方法之后,发现:在将"ScanSoft_MeiLing_ChineseMandarinVoice"语音库卸载,重新安装之

求科大讯飞语音合成的demo,C#,带源码

问题描述 求科大讯飞语音合成的demo,C#,带源码 解决方案 解决方案二:官方网站上没有么?不提供说明就属于机密文件..解决方案三:没钱就别玩这些了,yy伤身..解决方案四:我刚去官网下了一个看了一下,有C的源码.解决方案五:刚刚去论坛看了下,有啊,放百度网盘的