1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

中英文夹杂的“混合双打”如何解决语音转文字这一难题?

1987web2023-09-08人工智能AI122

语音消息有多方便,它就有多令人讨厌。

语音有没有优势?当然有,它包含说话人信息、包含情感信息,更丰富一点还能听到说话人的健康信息。但前提是建立在接收人的时间充裕的情况下,现在都是效率至上,为信息花费过多的时间成本并不怎么划算。

虽然很麻烦,但还是请你用语音转成文字再发送。不过社交软件的语音输入功能在识别准确率上一直以来都是个问题,尤其是某些总是想着秀优越的人,要么给你来一段不怎么标准的全英文,要么给你中文里夹杂着英语,让他转换成文字发出来,还不如手打来得快呢!

不只是那些人在美国,刚下飞机的优越党,很多人工作中的一些专有名词也需要使用英文单词指代,比如DNA序列测定、AMOLED屏幕。换做中文就会变成脱氧核糖核酸序列测定,以及有源矩阵有机发光二极体显示屏,大部分人可能都反应不过来:这说的到底是个啥?

语言混合输入是语音输入法的一大难点,不过,中国有句老话叫做车到山前必有路,聊天软件不行我们还可以求助第三方输入法。讯飞自2010年将业界首个中文语音输入法带到台前来,就一直是语音输入的标杆。在最新版本的讯飞输入法中(Android V9.1.9671,iOS V9.1.2930),全新升级的A.I.语音引擎将语音转文字的效果进一步提升。

举个例子,我们说出一段在一个阳光普照的moment,我欣喜若狂地拿到了大公司offer不怎么常见的句子,可以看到讯飞输入法很快就完成了语音转文字,并且无论语序还是词句,都没有任何谬误。

与拼音输入相比,键盘输入中英文往往需要进行语言上的切换,需要选词,效率上来看确实比语音要差很多。但在讯飞语音输入的加持下,无需切换语言、不用更改输入法设置,在默认模式下即可实现中英文语音混合输入转文字。

完整的英文语音输入对讯飞输入法来说更是不在话下,在默认识别模式下播放了一段TED演讲,相当长的一段英语原文,讯飞输入法识别准确并且在断句、排版上与手写几乎没有差别。如图所示,讯飞输入法并没有频繁使用./。来断句。

如果是完整的一句中文+一句英文,讯飞输入法的识别效果也同样准确。这一功能可以运用在多个场景中,比较典型的就是教学场景,学生请教英语,老师通过语音输入原文和翻译,效率提升不止一倍。

语音输入正成为一种潮流趋势,但消息接收方与发送方之间存在的矛盾却难以消弭,文字仍然是内容信息最直观的展示方式。讯飞输入法作为中国语音输入的领军人,通过不断升级迭代AI引擎的识别能力,增强对普通话、23种方言、9种外语的识别准确率,为双端用户带来满足自身需求的交流体验。