AI主播跨界“唱歌”,手语表达不输真人
近日,搜狗联合中国聋人协会共同推出手语数字人版公益MTV《万疆》,全球首个手语AI(人工智能)合成主播小聪跨界演绎、用唱手语歌的形式对《万疆》进行二次演绎,携手广大听障手语使用者一起唱红歌。
用手语唱歌本来就让人觉得很奇妙,而这次的MTV主角之一还是一位AI合成主播,更让人十分好奇。
虽然小聪号称是今年5月才刚亮相的全球首个手语AI合成主播,但在它之前,其实已有不少AI主播亮相了,比如2019年参与了两会新闻播报的AI主播新小浩与新小萌;而早在2018年的一场智能视频高峰论坛上,爱奇艺自制虚拟偶像奈奈,也是一位AI手语主播。
虚拟偶像从最初唱歌、画画、写诗,如今终于有了一项很务实的工作:AI主播,而且还可以是手语主播。它们的工作能力正逐步升级,让人惊艳。
AI主播可能将遍地开花
AI主播已不仅仅是在抖音等生活频道中的画画、写诗的视频主播,它们甚至已开始正式参与新闻播报。
2018年底至2019年初,搜狗与新华社联手,陆续发布了两位全仿真智能AI主持人新小萌和新小浩,它们是以新华社的真人主播屈萌和邱浩为原型打造的3D形象,还突破了过去坐着播新闻的形式,升级成结合肢体动作的站立式播报。它们在2019年参与当年全国两会新闻报道时大放光彩,不少人都以为它们是真人主播。尤其是新小浩与邱浩的连线互动,让人大呼精彩有趣。
这种人工智能与新闻采编深度融合的最新突破成果,一亮相就引发了全球关注。国外不少媒体都对此有过报道,称它们几可乱真。AI合成主播不仅能够24小时不间断地工作,还能在突发报道中快速生成新闻视频,这不仅提升电视新闻的制作效率,提高报道时效和质量,还降低了电视新闻的制作成本。有媒体甚至指出,虽然它们仍需要有人类编辑来整理播报内容,但它们有望替代普通的电视新闻播音员。
几乎是同步亮相的还有爱奇艺AI手语主播奈奈,它以二次元形象出现,通过语音识别并自动转换成手语表达的形式在现场播报新闻,引爆了2018中国网络视听大会。它不仅展示出AI即时手语翻译的能力,也以3D立体形象丰富可定制的特点,让这项技术能够适应不同场景的需求。不久,奈奈的升级版出现,它改头换面以适用于正式场合的真实人物形象登场,并通过一个手语学习APP开始实现普通应用,并同时在爱奇艺视频频道和新闻频道等合作中出现,也发挥出它应有的作用。
紧接着,AI新闻主播新小微、AI气象主播雅妮、俄罗斯语AI主播、社区AI法官、平安惠普的AI合成互动客服等纷纷登场。最近在新华社、央视等媒体上还出现一位柳岩同款的AI主播,它可以在同一条新闻中无缝切换多种方言,即使是柳岩本人都不会的方言也一样妙语连珠。如今又有了这位唱红歌的AI手语主播小聪亮相,一首《万疆》的跨界表现,就让人惊艳。
这意味着,不管你是否能接受,这些各怀绝技的AI主播已在一步步走进我们的生活,大有遍地开花之势。
AI手语主播干的是技术活
AI主播的确带给我们不少新鲜感,方言版的柳岩款AI主播甚至自带喜感。而AI手语主播的出现,则带来了更多务实价值。
手语是听障人士与外界进行交流以及获取信息的主要方式之一,但日常生活当中这种表达方式并不常见。我们在看电视、用手机刷视频时,其实也很少见到有同步的手语翻译。开发AI手语主播,需要更多的技术支持。
AI手语主播的工作原理是通过自动语音识别技术(ASR),准确识别视频中的语音并转换为文字,然后通过自然语言交互处理技术(NLP),将文字转换为手语内容,再通过虚拟AI人物进行输出。
这个过程说起来简单,但绝对是个技术活。以小聪为例,这位立足于搜狗领先的数字人技术体系的AI合成主播,便集成了超写实3D重光照扫描还原、3D数字人建模、机器翻译、多模态数字人生成、迁移学习、实时面部动作生成及驱动、表情肢体手势捕捉等多项领先AI技术,最终实现逼真度高、动作自然生动、手语表达准确的3D数字化主播的视频内容。
其中有一个细节值得留意:手语表达时的思维方式、顺序都跟语音表达均不相同。比如我们说开车不喝酒时,手语中的表达却是以开车喝酒不许这样顺序排列的三个手势。如果按照正常的语序来编排手语表达,就有可能导致绝大部分听障人士只能理解不足60%的内容。而现在的AI手语主播们却已注意到这个细节,它们的表现显然已符合一名合格的手语翻译的要求。经测评,小聪的手语表达对于听障人士来说,已能达到85%的可懂程度,相较于纯文字的信息传递也有了明显提高。
在《万疆》MTV中,可以看到小聪标准到位的手语肢体动作、比拟真人的细微表情,它准确演绎出了歌曲中家国自豪的澎湃情感,这对于一位数字人主播来说,在手部动作、面部表情、口动唇动准确表达程度等方面都要求颇高。相信它还可以在更多公共服务、特殊教育等场合下发挥自己作为手语主播的作用。
科技为人赋能,技术的终极目标还是人文关怀。随着5G时代的加速到来和AI技术的持续发展,AI主播还将给我们带来无限的应用想象,不妨拭目以待。
来源:金羊网
-
上一篇
天津理工大学聋人工学院学生通过手机App为手语识别系统进行数据采集。图/新华社
可以看到,有了这样一套应用广泛、可精准实时用手语讲述冬奥赛场动态的系统,将会大大增加手语直播的覆盖范围,让更多听障人士观赏冬奥会,实时感受冰雪赛场的脉动。这对听障人士而言,不啻为一份特殊的冬奥福音。
用技术跨越声音的障碍,让听障人士听见冬奥。冬奥AI主播的实时手语,是一束照向听障人士的希望之光,也打开了一扇手语AI主播做实时播报的大门。有了这样一套翻译系统的技术基础,手语AI主播应用领域可大大拓展,未来的世界杯等大型体育赛事以及重大的现场活动,手语AI主播将大有可为。
北京冬奥会是属于全世界的一件盛事,这一盛事的喜悦,也需要分享给听障人士。AI主播则是一份专属听障人士的特殊冬奥礼物。而通过科技赋能,让听障人士也能实时感受北京冬奥会的精彩与激情,也是全民共享这场冰雪盛会的最好体现。
特约评论员 | 和生(媒体人)
编辑 | 李潇潇
教AI主播打“手语”:一份专属听障人士的“冬奥礼物”快评
今年的北京冬奥会对听障人士而言,有些不同寻常。不少听障人士发现,此次冬奥的赛事新闻中出现了一名面容清秀的冬奥新闻AI主播,她精准的手语手势让听障人士与健听人(听
-
下一篇
央视AI手语主播亮相,网友:想看她跟朱广权battle