百度AI语音能力日均调用量超过100亿次
11月28日,百度首席技术官王海峰透露,百度大脑语音能力日均调用量超过100亿次。同日,百度大脑语音引擎发布、升级了14项产品和内容,包括基于百度鸿鹄语音芯片的4款硬件模组、开发板及3个场景解决方案,升级了语音自训练平台、呼叫中心语音解决方案等。
王海峰表示:AI技术的进化和产业赋能正向循环,相互促进,AI在应用场景中不断进化。百度的语音技术基于深度学习和产业应用,已应用到百度App,百度地图、小度音箱,百度输入法等百度产品,更通过AI开放平台赋能众多产业伙伴。百度大脑语音能力每天的调用量已经超过100亿。
据悉,百度大脑开放平台已开放228项AI能力,拥有超过150万开发者。针对智能硬件设备,百度大脑发布了基于百度鸿鹄语音芯片的4款硬件模组、开发板,以及智能家居、智能车载、智能IoT设备3个端到端软硬一体远场语音交互场景解决方案。
在语音识别领域,百度大脑升级了短语音识别、实时语音识别能力,发布了音频文件转写能力,升级了可零代码提升业务术语识别率的语音自训练平台,以及呼叫中心语音解决方案。针对语音合成,百度大脑发布了6个在线语音合成精品音库和5个离线语音合成精品音库,对语音能力,助力智能硬件、互联网、呼叫中心等领域进行了智能化升级。
除了升级产品,百度语音首席架构师贾磊介绍了基于复数CNN网络的语音增强和语音识别一体化端到端建模技术,该方法抛弃了数字信号处理学科和语音识别学科的各种先验假设,直接端到端进行一体化建模。相较于传统基于数字信号处理的麦克阵列算法,新技术的错误率降低了超过30%。目前该方法已经被集成到百度最新发布的百度鸿鹄芯片中。
百度大脑目前已开放了云、端、芯包含语音识别、语音合成等全栈语音引擎能力,并应用于金融、政务、文娱等多种行业和场景。
创维AIoT研究院产品经理李凯表示,大屏IoT的行业痛点在于信息检索难和设备控制操作复杂。通过增加语音交互能力,创维和百度重构了整个AIoT设备生态的交互体验,在电视方面的合作成果已落地在10个电视芯片型号、2500万台电视上。在下一代远场语音方案中,百度鸿鹄语音芯片为创维产品带来了高性价比硬件、整合优化的软件算法等价值,双方将基于百度鸿鹄芯片展开多项产品合作。
瓴岳科技信贷运营总监宋力介绍,依托百度大脑呼叫中心实时语音识别等AI服务,瓴岳科技打造了降本提效的智能机器人,智能机器人、智能语音质检的应用,让瓴岳科技的贷后人力投入降低61.47%。
北京子杰宝贝科技有限公司项目经理肖云峰说:我们开发的智能录入系统,在百度大脑语音自训练平台进行语音识别模型训练,识别率从80%提升至95%以上。该系统有效降低了医护人员的工作强度,提升了临床护理效率。
在农业领域,从业者也遇到了农业作物专业词汇语音识别率低的问题。华智生物信息技术主任龙晓波表示,得益于百度大脑语音自训练平台,公司的农业结构化性状数据语音识别准确率从71.09%提升至98.75%,采集一个测试田地性状信息从300人工时降低到160人工时,工作效率提升了一倍。
善行智能联合创始人黄小瑰介绍,基于百度大脑语音等技术打造的小Q智能导盲眼镜,帮助盲人生活出行,为失能人群提供智能化的帮助。
据悉,百度大脑推出了因AI而声公益计划,将为提供公益性服务的公司或组织,提供语音技术免费、专属语音技术支持等福利。