你能听到我吗?什么是AI语音识别?
在一个痴迷于速度和便利性的世界中,AI语音识别创造了一个时代,您可以简单地与您的计算机,智能手机或家庭集线器通信,并获得您正在寻找的答案,而无需在键盘上键入任何内容。
本质上,它是关于教授计算机如何处理音频数据,而不是它曾经使用的标准书面或基于文本的数据。这项技术逐渐被用来取代点击和打字等其他输入方法,但它远非完美。毕竟,人类的言语并不一定遵循计算机蓬勃发展的简单规则、词汇、俚语甚至方言的差异都会使机器混乱,使他们更难完成工作。
然而,尽管出现了障碍,市场上不断出现的设备越来越多,这些设备充分利用了语音识别解决方案。事实上,在不久的将来,西方世界几乎每个人都可以在家中或工作中使用语音识别软件。
语音识别来自哪里?
与当今世界如此多的科学发现领域一样,机器学习是我们在语音识别方面取得的许多突破的原因。谷歌结合了最新的基于云的计算数据,通过机器学习算法分享有价值的信息,帮助他们从以前的交互中获取天文数字。
虽然语音识别已经存在了一段时间,但正是苹果进入语音识别市场的Siri才正式吸引了公众的想象力。在数十年的研究推动下,Siri成为第一个将人性和特性带入复杂的语音识别世界的人工智能助手。从那时起,市场继续以天文数字的速度增长,包括微软Cortana,亚马逊Alexa等。
语音识别的演变本质
虽然大多数人在想到语音识别时仍然会想到效率低下的IVR和混乱的机器人,但AI世界中自然语言处理和自然语言理解的发展有助于确保今天的计算机比以往任何时候都能理解更多。事实上,微软的语音识别系统可以以最低5.1%的错误率转录人类速率。
帮助语音识别技术发展的关键创新之一是将面向上下文的算法引入AI世界。通过将上下文引入分析,计算机更容易猜测人们在转录过程中所说的内容。例如,可能很难分辨出这不公平和那不是毛皮这些短语之间的区别。但是,如果机器知道会话是关于时尚的,那么第二个实例可能更有可能。
人工智能语音识别的常见应用
语音识别技术在许多不同领域越来越受欢迎。例如,它在设备控制中很常见,用户可以简单地说Ok Google在智能手机上启动搜索。此外,在商业世界中,语音识别被更频繁地用于语音转录任务,其中人们需要经历大量数据以找到用于合规或记录目的的重要信息。
尽管在语音识别技术完全准确之前还有很长的路要走,但我们正在逐步走向一个能够与我们的计算机交谈的世界。
排版 | 平生
来源 |Medium
YOU MAY ALSO LIKE
| 往期推送 |