教你免费白嫖各大知名互联网公司的「文字转语音、语音转文字」服务!
先说「文字转语音」,再讲「语音转文字」
▍1 文字转语音
文字转语音,国内基本上看讯飞,但百度凭借自身做AI的实力,在语言识别这方面还是不错的
● 1.1 讯飞开放平台(最推荐)
网址:https://xfyun.cn/services/online_tts
- 科大讯飞是最早开始做语音识别服务的企业,也是国家唯一专门做语音产业的863计划成果,目前在语音识别领域市场占有率大概70%多
- 讯飞做语音业务早,公司应该是1999年成立的,就开始做语音业务。很多手机中都再使用讯飞语音引擎
- 百度语音业务属于后起之秀,不过综合来说和讯飞还有一些差距。
使用方法如下:打开网页,往下翻,翻到「产品体验」
讯飞拥有超级丰富的发音人资源!!!
甚至各种小语种,各种方言都有
选择你想合成的文字,然后点击立即合成
原本我们可以靠IDM等软件直接下载合成后的语音的,但讯飞为了避免大家白嫖现在加大限制了
但我们还可以通过内录电脑音频来解决
阿虚提供一款录音工具,可以仅录制从电脑播放的声音
点击下载软件
打开软件,设置一下仅录制从电脑播放的声音
接着播放网页合成的语音,就能够用这款软件录制下来了
缺点就是一次只能合成250字了
● 1.2 讯飞有声(安卓 / IOS)
打开软件,点击「开始朗读」
输入你想转为语音的文字后,点击右上角分享按钮,选择短信,这样你会得到一个网页链接
在电脑上打开这个网页
这里需要用到网页嗅探的办法来下载音频,如果你还不会,请去看阿虚之前写的教程:你一定要会的网页资源嗅探,下载任意网页的一切资源
等待语音播放完,用Chrome浏览器的Chrono扩展来嗅探资源,在Chrono资源嗅探器中,我们可以看到识别出了3段音频。
前两段是正文语音,最后一段是被加入的语音广告
下载前两段后,我们用一些音频编辑软件,把这两段语音合并起来备注
阿虚这里推荐三款自用珍藏版的单文件版软件: ????、Audacity、WavePad
点击下载这3款软件
这里阿虚用的是Audacity
● 1.3 讯飞快读(网页 / 微信小程序)
讯飞子公司推出的产品,所以用的其实还是迅飞的技术,使用网页版需要使用微信登录
免费用户限制单次800字
虽然非会员本来是不能下载mp3的!
但是只要你学会了网页资源嗅探,就能不开会员直接下载了
如果你还不会,请去看阿虚之前写的教程:你一定要会的网页资源嗅探,下载任意网页的一切资源
最后就是,此网页下载的音频会在文末添加一段语音广告,所以还是需要你自己手动用音频编辑软件删除多余的广告部分
同时此网站提供微信小程序
● 1.4 讯飞配音(安卓 / IOS)
这款软件大概不能叫文字转语音了,就真的是花钱找人配音...
按字数收费,而且这个价格说实话阿虚觉得挺高的,特殊场景可能才会用的上吧
▍2 语音转文字
语音转文字要求的技术成本就要多的多了,所以这一般都是收费服务,而且还比较贵!
但如果你对语音转文字需求不大的话(偶尔用一下)
,实际上还是有一些办法白嫖的
● 2.1 讯飞听见(网页 / 安卓 / IOS)
本来这是个收费的服务,分为以下2种
- 中文/英文机器快转:0.33元/分钟;
- 中文人工精转:音质清晰、标准普通话、语速正常非专业领域的音频价格为80元/小时,具体价格与音频质量以及需求相关;人工精转订单起步价为18元,订单金额不足18元按18元计费。
但因为讯飞网页端提供了中文/英文机器快转的免费体验,所以...其实就有办法白嫖
打开官网后,点击上传音频,上传音频之后接着点击转写预览
稍等1分钟就会识别完毕,(这个音频是用讯飞生成的音频,然后我又把它上传转写为文字)
可以看到当发音标准时,识别率基本上达到100%
但这个时候就有个问题了:上面这个页面的文字,是不能复制的!
这个时候我们就需要用到图片文字识别软件了,阿虚之前写过:从手机到电脑,究竟哪款OCR图片文字识别软件最好用?没看过的话,建议去看看并下载一个软件
下面阿虚使用的是天若OCR这个小软件来获取文字
讯飞语音只提供音频前3分钟的免费转写预览,所以如果你的音频比较长的话,你需要用音频编辑软件手动切割一下音频
阿虚这里推荐三款自用珍藏版的单文件版软件: ????、Audacity、WavePad
具体使用软件怎么切割的话,请自行摸索一下,或者百度一下,阿虚这里就不多说明了
点击下载这3款软件
● 2.2 讯飞语记(安卓 / IOS / Windows)
- 这实际上算一款笔记软件,提供实时录音转写,所以你可以用任意其他设备播放音频,然后用讯飞语记来听写...
- 当然,你也可以用讯飞输入法来听写
- 讯飞语记也提供外部录音转写(同样是收费0.33元/分钟)
● 2.3 百度语音接口
网址:https://cloud.baidu.com/product/speech
百度AI开放平台,提供了免费的语音识别服务,但是没有提供在线试用
想要使用的话,需要你具有一定的开发能力,开发软件来使用接口。
但好在已经有大大开发了图形化界面的软件,我们只需要去简单的申请一个应用,就能免费使用接口了
❶获取百度语音接口
打开网址:https://cloud.baidu.com/product/speech,点击「立即使用」,并登录你的百度账号
点击创建应用
只需随便填写应用名称和应用描述,然后直接点击立即创建就行了
创建好之后,点击「返回应用列表」
然后就能获取到我们需要的API Key和Secret Key了
❷万能君的小工具
作者:https://52pojie.cn/thread-981080-1-1.html
点击下载软件
下载后解压解压解压!然后双击main.exe运行即可,注意运行弹出的黑窗不能关(可以最小化)
打开软件后点击左上角参数配置
填写我们刚刚获取的Key
注意:个人用户有免费次数限制,不过百度免费次数个人用,肯定够用了
同理,你可以在本软件中填写其他百度免费提供的其他API接口
- 语音转文字:http://ai.baidu.com/tech/speech/asrpro
- 截图文字识别:http://ai.baidu.com/tech/ocr/general
- 文字转语音:http://ai.baidu.com/tech/speech/tts
- 复制翻译:http://fanyi-api.baidu.com/api/trans/product/index
● 2.4 i笛云听写(网页/安卓)
官网:http://voiceclub.cn/index.html
免费的语音转文字服务
如果你觉得我写的文章不错,欢迎来找我啊(看下图!!!)