罗技推出能做翻译的鼠标!每分钟听写400字,百度AI语音加持
智东西(公众号:zhidxcom)
作者 | 屈望苗
编辑 | 江心白
智东西4月13日报道,今天,百度与罗技联合发布了VOICE M380语音鼠标。其中搭载了百度语音识别和机器翻译两大技术,中文语音识别率可达98.6%,具有每分钟400字的听写能力。
M380鼠标白色款,单击其上的绿色按钮可开始和结束语音输入,双击可切换模式
罗技大中华区PW&PC品类营销总监张亮说,近年来语音输入成为了年轻人新宠,中国用户今年发送语音的条数高达61亿条,较去年增长26%,而PC端的语音输入成为了一个新的发力点。
罗技大中华区PW&PC品类营销总监张亮致辞
百度总监蔡玉婷还提到,这次合作基于百度的AI语音输入系统和罗技的硬件能力,未来还将拓展会议、游戏等多个应用场景,实现更多产品的AI赋能。
一、识别准确率达98.6%,支持8种语言翻译
M380鼠标有多国语音输入、语音翻译、中英自由说和离在线语音四大性能。
1、多国语音输入。据张亮介绍,M380鼠标通过搭载百度语音输入技术,其文字识别准确率可以达到98.6%,而且还能实现不同语种和方言的识别和输入,如英语、法语、日语、汉语,以及合肥话、西安话、粤语等。
2、语音翻译。M380鼠标搭载了此次发布会首发的百度语音输入,支持8种语言的翻译。机器翻译是百度大脑上最具优势的技术之一,百度翻译的机器翻译功能已经支持203种语言互译。
3、中英自由说。中英自由说是一种新的模式,支持自动实现中英文混合语音输入而无需用户切换。
百度总监蔡玉婷介绍中英自由说功能
4、离在线语音。这款鼠标还具有离在线融合模式。张亮介绍时提到,这是百度软件的独有技术,使这款鼠标能自动判断当前网络环境,在网络信号好的场景下可以提供更佳的识别和翻译功能,网络不稳定时也能保证听写功能正常运行。
在外观设计方面,M380鼠标有黑色和白色两种款式,外观符合人体工学,适合长时间抓握,同时使用罗技独家技术Unifying无线连接,在10米范围内连接稳定。此外,这款鼠标内置一节AA电池,续航时间长达18个月。
罗技大中华区PW&PC品类营销总监张亮介绍M380鼠标
M380鼠标的用户群体主要有重度内容创作者、追求效率的年轻专业人士,以及泛行业各领域的从业者等。
蔡玉婷提到,百度的AI语音技术将通过罗技的鼠标产品应用到智能办公场景,比如文档撰写、外语识别、个人笔记,以及中文转译等。未来还将搭载罗技的其他硬件设备,如会议设备和游戏设备等,拓展更多场景,为消费者带来更极致的体验。
百度的AI能为人们的生活带来便利,用科技让这个复杂的世界更简单。她说。
二、百度大脑加持,未来还将拓展至会议、游戏
在蔡玉婷看来,百度不仅是强大的搜索引擎,还是一家拥有强大互联网技术的AI公司,希望借助AI探索产业智能化的升级。百度大脑是百度AI能力的集大成者,截至去年已经升级到6.0版本,成为了大型的软硬一体AI生产平台。
百度大脑的AI能力正在不断输出到社会各界,赋能各个行业。而罗技是电脑外设领域的领导者,希望通过AI赋能实现全产品线的智能化升级。而且双方都想要让人们的工作和生活更加便捷,这一共同目标促成了这次合作。
百度集团副总裁吴甜认为,随着技术发展,人们的工作和生活日新月异,市场需求也在不断变化。而百度很早就开始利用AI技术提升产品体验,并将成果沉淀在百度大脑系统中。
百度集团副总裁吴甜致辞
百度大脑的基础层建设了数据、算力和AI框架,感知层能力上建设了语音技术、视觉技术和AR/VR等,认知层面上有自然语言处理等AI技术。语音技术和百度翻译是百度大脑的两个经典的AI技术。
语音技术方面,早在2012年,百度首次将深度学习技术应用到语音识别中,语音搜索功能免去了用户打字的烦恼,对儿童和老人等群体十分友好。近几年百度在这方面也有了新的进展,比如将流式截断的多层注意力建模(SMLTA)模型上线百度语音输入法,将基于麦克风阵列的拼音增强以及声学建模一体化的端到端识别技术应用到小度音箱等,提升了交互体验。
罗技大中华区PW&PC品类营销总监张亮介绍百度语音输入
目前,百度语音服务的日调用量已达到155亿次,移动端方面有百度搜索、百度输入法等应用,应用场景方面有智能家居、智能车载系统等,还推出了语音AI芯片百度鸿鹄,可以应用于智能音箱、车载系统等。
而百度翻译是另一项主要的AI技术,曾获国家科技进步二等奖。2015年,百度首次将基于深度学习的机器翻译网络上线网络产品,目前百度的机器翻译系统已经能支持203种语种的翻译,每天的翻译量可达1000亿字,服务于5亿用户,为跨语种交流带来便利。
结语:软硬件协同发展,语音输入还将升级
此次百度与罗技的合作是一次软硬一体、AI赋能的实践,未来,语音输入还会有更大的发展空间和更丰富的应用场景。
正如百度语音首席架构师贾磊介绍的,通过大数据训练和更大的模型,语音输入技术会适合更复杂的场景;伴随着与硬件设备的协同发展,语音输入可以听得更远、更清;语音输入系统还会更加情感化、个人化,如使用亲人声音的语音导航等,这些都可能成为未来语音技术的发展方向。
-
上一篇
AI绘画软件怎么画出彩铅效果?
AI绘画软件怎么画出彩铅效果?AI绘画软件在当今艺术领域中扮演着重要的角色。随着科技的不断进步,AI绘画软件不仅能够模拟传统绘画的效果,还能够提供更
-
下一篇
会上,猎豹移动董事长兼CEO、猎户星空董事长傅盛在《大模型下半场,企业如何AI创新?》主题演讲中的精彩观点如下:
1.语义理解是人工智能皇冠上的明珠
2.ChatGPT带来了交互革命与生产力革命
3.大模型应用未来可期,未来每个公司都有自己的大模型
4.用新范式思考做大模型应用的机会
以下为演讲/对话内容,由创业邦整理:
语义理解是人工智能皇冠上的明珠
大模型的下半场,这个标题也不是我起的,是我们有一次在群里讨论,一个朋友发了一篇文章《大模型下半场》,我们所有人都说下半场了, 那上半场在哪里?我想说,这正好说明了大模型这个行业这次人工智能浪潮发展是如此之快,几乎就是日新月异。我记得在去年的时候,我在APP store上搜AI打头的APP就没有几个,到今年3月份就一大堆,当时我就感叹了一句,这真的是一次寒武纪生物大爆发,这次AI带来了非常大的机会,机会到底在哪里,我结合自己创业的思考和大家一起分享一下。
作为每个创业者其实最要学习的就是第一性原理,无论是一个技术也好,是一个产品也好,你得在最底层知道它为什么会这样。其实我最早的时候给自己起了一个命题,为什么ChatGPT一款聊天软件,大家认为它会改变世界。我在2016年开始就投身于人工智能,做人工智能+服务机器人的创业活动。当时行业内是非常的乐观,就在AlphaGo战胜了李世石之后,大家认为人工智能的时代到了,所以就应该很快自动驾驶会出现,一个懂你的机器人会出现。但事实上经过了第一波人工智能1.0发展之后,人工智能行业遇到了天花板,最大的天花板就是语义理解。
语义理解是人工智能行业皇冠上的明珠,为什么是明珠呢?大家想100年前图灵在计算机都没有真正被发明之前,人们做了一个思维实验,如何证明以后一个机器具备了人的智能,这就是图灵测试。图灵测试的核心就是,跟它说话,它听得懂,你不知道它是一个机器。我想这个想法是如此的伟大,到今天也是这样的。因为语言事实上是人和其他动物真正智能的区别。识别这件事,你会识别,你家的狗也会识别,看到你就很开心,看到别人就汪汪叫,猴子也会识别。所以图像识别也好,这些都不是人类独有的智能,只有语言。《人类简史》里说,人类真正能够战胜其他物种,我们的祖先智人能够崛起于这个世界,成为世界的霸主,最核心就是语言能力,尤其是描述虚拟事物的能力。虚拟事物的核心就是逻辑,因为有了语言我们才有了逻辑。
大家都知道语义理解是最核心的,我们认为是有两条技术路线,第一条路是学外语模式,我教你语法规则,主谓宾,然后背单词,知识图谱,capital是首都,首都的意思是什么。这个好处是什么呢,只要你用知识图谱和语法规则教计算机模型以后,它很快就会开始回答。事实上它的回答一直突破不了天花板,就像我们学了很久的英语,你第一天去美国,和海关说话都不太懂。这里有一个逻辑,虽然外语模式很快能见效,但我们学外语时已经有母语了,只有OpenAI当时觉得我们能不能用学母语的模式?这就是第二条路是学母语模式。就是不告诉你任何知识,你就在这里天天听,就跟小孩一样在旁边听,突然有一天他就开口说话了,和你交流了。
傅盛:大模型下半场,企业如何AI创新?
8月22-23日,2023DEMOWORLD企业开放式创新大会在长三角G60科创走廊策源地松江隆重举行。本届大会由创业邦主办,松江区经济委员会、松江区投资促