1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

观冬奥·向未来丨AI手语虚拟主播现身分析师:冬奥会是大众了解虚拟数字人价值的契机

1987web2023-09-02人工智能AI116
每经:可杨每经编辑:张海妮

每经:可杨 每经编辑:张海妮

2月4日晚间,北京2022年冬奥会开幕式在国家体育场鸟巢举行。本届冬奥会期间,虚拟数字人成为重要技术之一,中央广播电视总台新增了央视新闻AI手语虚拟主播,报道冬奥会新闻、准确及时地进行赛事手语直播。据悉,这名虚拟数字人主播是由百度智能云曦灵数字人平台打造的首个AI手语主播。

虚拟数字人背后,涉及计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等多种技术。随着2021年元宇宙概念持续火热,虚拟数字人也作为元宇宙的场景入口和连接纽带而备受瞩目,而冬奥会上的虚拟数字人元素,也将让大众进一步认识这项技术。

不过虚拟数字人要实现大规模商业化,仍有难题待解。百度智能云AI人机交互实验室负责人李士岩介绍,目前数字人尚未实现规模化产业落地,主要原因在于数字人制作技术门槛高、周期长、成本高。

AI手语主播助力听障人士观冬奥

据百度提供的数据,全球约有4.3亿人患中度及以上听力障碍,根据全国第二次残疾人抽样调查数据,中国有听障人士2780万。而在本次冬奥赛事中,AI手语数字人也将成为他们观赛的重要桥梁。

百度方面介绍,区别于传统翻译,手语翻译的难点在于:手语并非按照语言逐字翻译,而需要根据语句整体意思进行语言精炼和语序调整,同时还需实时配合表情和唇语,帮助听障者更好地理解。这就导致AI手语数字人在信息凝练度、低时延和精细化三方面面临极其复杂的技术难题。因此,AI手语主播不仅需要具备高精度的数字人形象,还需要具备能够语音识别、手语翻译和手语表达的AI大脑。

据悉,百度智能云目前建立了规模庞大的手语动作库,基于《国家通用手语词典》规范,结合动作捕捉设备和真实手语老师的双向调优,精修近1万个手语动作,保证了手语表达的动作准确性。同时,通过4D扫描技术,让AI手语主播口型生成准确度达到98.5%。

而虚拟手语主播的AI大脑则依托于百度智能云。通过百度自主研发的机器翻译技术,百度智能云构建出⼀套精确的手语翻译引擎,可懂度达到85%以上,结合百度自研的语音识别技术,可将冰雪赛事的文字及音视频内容,快速精准地转化为手语;同时再通过专为手语优化的自然动作引擎,完成AI手语主播的动作驱动,实时演绎为数字人的动作、表情和唇语。据百度方面介绍,这一虚拟数字人研发工作,耗时不到2个月。

虚拟数字人技术为何能在此次冬奥会期间成为重要技术之一,易观分析互娱行业高级分析师王媛娅认为,中国很多领域在新技术应用方面很超前,具有很强的创新意识。在本届冬奥会上,虚拟数字人是为观众带来极致体验的重要方式之一,随着虚拟数字人在这几年受到越来越多的关注,通过虚拟数字人来展示内容已变得越来越常见。虚拟数字人不仅仅能在疫情期间控制现场演员数量,更能够用科技演绎艺术,为观众带来更新颖更多元的表演。

她同时表示,冬奥会开幕式是让大众了解虚拟数字人价值的契机。她提到,目前很多厂商正在布局或者计划布局虚拟数字人赛道,由于虚拟数字人是基于3D、VR、动作捕捉等一些技术实现的,随着科技的进步、市场需求的增加和冬奥会的助推,虚拟数字人会越来越成熟,进一步进入大众视野。除了直播带货和演出,虚拟数字人会在更多领域得到商业化机会。

虚拟数字人商业化仍有难题待解

据元透社发布的《虚拟数字人深度产业报告》,预计2030年,我国虚拟数字人整体市场规模将达到2700亿元,而目前市场仍处于前期培养阶段。

王媛娅认为,目前国内虚拟数字人刚刚从探索期过渡到成长期,成为元宇宙生态中快速发展的赛道。最近几年,虚拟数字人的应用领域逐渐拓宽,功能属性加强,已不再是二次元专属,比如现在已经有了虚拟KOL、虚拟主持人、虚拟客服等很多角色,商业价值也在直播带货场景中得到了验证。以初音未来为代表的海外头部虚拟数字人在探索期已建立全球影响力。同时,一些国外头部厂商开始关注虚拟数字人在B端的应用,并且已经推出了一些服务于B端市场的产品。

百度智能云AI人机交互实验室负责人李士岩介绍,目前数字人尚未实现规模化产业落地,主要原因在于数字人制作技术门槛高、周期长、成本高。打造一个高精度、高保真的非特异型虚拟数字人,动辄就需要百万甚至上千万的资金投入。

李士岩表示,虚拟数字人产业格局中,提供建模、渲染、动态捕捉等服务于数字人制作的基础设施服务商已形成稳固格局,大多由海外巨头把持。但在工具、应用层,中国企业已开始崭露头角。

不过,数字人规模化落地还面临三大难点:产业链割裂、服务场景与演艺场景没有有效打通、满足高频需求成本高。

对于虚拟数字人大规模商业化所面临的难题,王媛娅认为,市场对虚拟数字人的关注度会持续上升,也会有越来越多的企业投入打造虚拟数字人。但是懂技术、懂美术、又懂偶像运营的公司太少,所以未来需要产业链各方企业合作联合推出虚拟数字人,或者大型公司联合多个业务部门推出。因此,短时间内不太可能出现可以接近初音的,但是有可能会再出一个洛天依或lovelive。

对于虚拟数字人未来的发展,李士岩表示,数字人产业有三大核心推动力:第一级是用户需求与技术升级,第二级是政策支持与资本涌入,第三级是计算平台的迭代。每一次数字人发展本质上都是技术推动的,用户从平面的图文影音获取信息与交互,向实时3D交互反馈的需求转变。

百度集团副总裁吴甜则表示:百度已发布集数字人生产、内容创作、业务配置服务为一体的智能数字人平台百度智能云曦灵,希望通过全栈AI能力,把虚拟数字人的生产周期缩短到小时级别,降低生产成本,并且用AI驱动生成内容。

每日经济新闻