百度Ai语音识别-文字转语音
2020
04
08
语音识别-文字转语音
01
前言
接上一期内容,这次利用百度Ai提供的语音合成api,将获取到的小说文字数据,转化为音频数据。需要有一个百度账号,然后再创建一个语音合成的应用,参照官方python调用百度语音合成api接口详细文档。
02
创建应用
百度Ai语音识别官方网址:
https://ai.baidu.com/tech/speech
点击立即使用
登录自己账号后创建应用
这里应用信息任意填就行了
把APP_ID、API_KEY、SECRET_KEY对应的值,分别复制到编译器中,待会需要用到
03
Python中调用
先在Terminal中安装两个库 baidu-aip,playsound,playsound:音频播放模块
pipinstallbaidu-aip百度的接口
pipinstallplaysound
参照官方的Python接口文档可自己设置发声人、音量、速度等。需要注意的是:毕竟我们用的是免费的,百度ai是有每天读取数量限制的,具体可在官方文档查看,调用超额会转换失败,需要大量转换的只能等到第二天或者自己付费购买了
04
执行示例
这里拿获取的一章数据来演示转换,就不演示语音效果了,我这里没有放出我自己的APPID AK SK,把他替换为你们自己创建应用时生成的三个Key就行了
示例代码
Python
fromaipimportAipSpeech导入api接口
fromplaysoundimportplaysound音频模块
""" 你自己的 APPID AK SK """
APP_ID =你自己的 APPID
API_KEY =你自己的 AK
SECRET_KEY =你自己的 SK
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
withopen(r第五十九章 北海有墓碑.txt,r, encoding=utf-8)asf:
data = f.read()
per: 4 发声人选择,0为女声,1为男声,3为情感合成-度逍遥,4为情感合成-度丫丫,默认为普通女
result = client.synthesis(data,zh,1, {
per:4,
spd:3,速度
vol:7音量
})
ifnotisinstance(result, dict):
withopen(test.mp3,wb)asf:
f.write(result)
播放
playsound("test.mp3")
05
转换成功
文字数据转语音成功:
这还只是一个写死的程序,为了方便操作可以加入UI界面,引用tkinter插件来读取本地的文件,最后将程序导出为可执行文件就可以随时转换本地的数据文件了。
06
编程之外
最后给出一些建议,也来警醒自己:
Programmer现在是处于饱和状态,需要提前准备介入,多努力学习,多敲代码,不要偷懒,多拓展知识,认真准备简历,掌握一些面试技巧,认真努力工作,咬牙坚持下来,度过那段适应期,定会拔云见日。
CSDN:与世间美好环环相扣
公众号:编程之外
扫码关注编程之外