1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

教你免费白嫖各大知名互联网公司的「文字转语音、语音转文字」服务!

1987web2023-08-07人工智能AI120
先说「文字转语音」,再讲「语音转文字」

先说「文字转语音」,再讲「语音转文字」

▍1 文字转语音

文字转语音,国内基本上看讯飞,但百度凭借自身做AI的实力,在语言识别这方面还是不错的

● 1.1 讯飞开放平台(最推荐)

网址:https://xfyun.cn/services/online_tts

  • 科大讯飞是最早开始做语音识别服务的企业,也是国家唯一专门做语音产业的863计划成果,目前在语音识别领域市场占有率大概70%多
  • 讯飞做语音业务早,公司应该是1999年成立的,就开始做语音业务。很多手机中都再使用讯飞语音引擎
  • 百度语音业务属于后起之秀,不过综合来说和讯飞还有一些差距。

使用方法如下:打开网页,往下翻,翻到「产品体验」

讯飞拥有超级丰富的发音人资源!!!

甚至各种小语种,各种方言都有

选择你想合成的文字,然后点击立即合成

原本我们可以靠IDM等软件直接下载合成后的语音的,但讯飞为了避免大家白嫖现在加大限制了

但我们还可以通过内录电脑音频来解决

阿虚提供一款录音工具,可以仅录制从电脑播放的声音

点击下载软件

打开软件,设置一下仅录制从电脑播放的声音

接着播放网页合成的语音,就能够用这款软件录制下来了

缺点就是一次只能合成250字了

● 1.2 讯飞有声(安卓 / IOS)

官网下载:http://xfyousheng.com

打开软件,点击「开始朗读」

输入你想转为语音的文字后,点击右上角分享按钮,选择短信,这样你会得到一个网页链接

在电脑上打开这个网页

这里需要用到网页嗅探的办法来下载音频,如果你还不会,请去看阿虚之前写的教程:你一定要会的网页资源嗅探,下载任意网页的一切资源

等待语音播放完,用Chrome浏览器的Chrono扩展来嗅探资源,在Chrono资源嗅探器中,我们可以看到识别出了3段音频。

前两段是正文语音,最后一段是被加入的语音广告

下载前两段后,我们用一些音频编辑软件,把这两段语音合并起来备注

阿虚这里推荐三款自用珍藏版的单文件版软件: ????、Audacity、WavePad

点击下载这3款软件

这里阿虚用的是Audacity

● 1.3 讯飞快读(网页 / 微信小程序)

网址:https://ffkuaidu.com/

讯飞子公司推出的产品,所以用的其实还是迅飞的技术,使用网页版需要使用微信登录

免费用户限制单次800字

虽然非会员本来是不能下载mp3的!

但是只要你学会了网页资源嗅探,就能不开会员直接下载了

如果你还不会,请去看阿虚之前写的教程:你一定要会的网页资源嗅探,下载任意网页的一切资源

最后就是,此网页下载的音频会在文末添加一段语音广告,所以还是需要你自己手动用音频编辑软件删除多余的广告部分

同时此网站提供微信小程序

● 1.4 讯飞配音(安卓 / IOS)

官网:http://peiyin.xunfei.cn/

这款软件大概不能叫文字转语音了,就真的是花钱找人配音...

按字数收费,而且这个价格说实话阿虚觉得挺高的,特殊场景可能才会用的上吧

▍2 语音转文字

语音转文字要求的技术成本就要多的多了,所以这一般都是收费服务,而且还比较贵!

但如果你对语音转文字需求不大的话(偶尔用一下),实际上还是有一些办法白嫖的

● 2.1 讯飞听见(网页 / 安卓 / IOS)

网页:https://iflyrec.com/

本来这是个收费的服务,分为以下2种

  • 中文/英文机器快转:0.33元/分钟;
  • 中文人工精转:音质清晰、标准普通话、语速正常非专业领域的音频价格为80元/小时,具体价格与音频质量以及需求相关;人工精转订单起步价为18元,订单金额不足18元按18元计费。

但因为讯飞网页端提供了中文/英文机器快转的免费体验,所以...其实就有办法白嫖

打开官网后,点击上传音频,上传音频之后接着点击转写预览

稍等1分钟就会识别完毕,(这个音频是用讯飞生成的音频,然后我又把它上传转写为文字)可以看到当发音标准时,识别率基本上达到100%

但这个时候就有个问题了:上面这个页面的文字,是不能复制的!

这个时候我们就需要用到图片文字识别软件了,阿虚之前写过:从手机到电脑,究竟哪款OCR图片文字识别软件最好用?没看过的话,建议去看看并下载一个软件

下面阿虚使用的是天若OCR这个小软件来获取文字

讯飞语音只提供音频前3分钟的免费转写预览,所以如果你的音频比较长的话,你需要用音频编辑软件手动切割一下音频

阿虚这里推荐三款自用珍藏版的单文件版软件: ????、Audacity、WavePad

具体使用软件怎么切割的话,请自行摸索一下,或者百度一下,阿虚这里就不多说明了

点击下载这3款软件

● 2.2 讯飞语记(安卓 / IOS / Windows)

官网:http://iyuji.cn/iyuji/home

  • 这实际上算一款笔记软件,提供实时录音转写,所以你可以用任意其他设备播放音频,然后用讯飞语记来听写...
  • 当然,你也可以用讯飞输入法来听写
  • 讯飞语记也提供外部录音转写(同样是收费0.33元/分钟)

● 2.3 百度语音接口

网址:https://cloud.baidu.com/product/speech

百度AI开放平台,提供了免费的语音识别服务,但是没有提供在线试用

想要使用的话,需要你具有一定的开发能力,开发软件来使用接口。

但好在已经有大大开发了图形化界面的软件,我们只需要去简单的申请一个应用,就能免费使用接口了

❶获取百度语音接口

打开网址:https://cloud.baidu.com/product/speech,点击「立即使用」,并登录你的百度账号

点击创建应用

只需随便填写应用名称和应用描述,然后直接点击立即创建就行了

创建好之后,点击「返回应用列表」

然后就能获取到我们需要的API KeySecret Key

❷万能君的小工具

作者:https://52pojie.cn/thread-981080-1-1.html

点击下载软件

下载后解压解压解压!然后双击main.exe运行即可,注意运行弹出的黑窗不能关(可以最小化)

打开软件后点击左上角参数配置

填写我们刚刚获取的Key

注意:个人用户有免费次数限制,不过百度免费次数个人用,肯定够用了

同理,你可以在本软件中填写其他百度免费提供的其他API接口

● 2.4 i笛云听写(网页/安卓)

官网:http://voiceclub.cn/index.html

免费的语音转文字服务

如果你觉得我写的文章不错,欢迎来找我啊(看下图!!!)