1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

虚拟数字人有什么特点?其发展趋势怎么样?

1987web2023-10-07人工智能AI141

目录

中国虚拟数字人行业市场概述

基本概念与分类

虚拟数字人概念的起源:虚拟数字人一词最早源于1989年美国国立医学图书馆发起的可视人计划(VisibleHumanProject,YHP)。2001年,国内以中国数字化虚拟人体的科技问题为主题的香山科学会议第174次学术讨论会提出了数字化虚拟人体的概念。这些虚拟数字人主要是指通过数字技术模拟真实的人体器官而合成的三维模型,主要应用于医疗领域的人体解剖教学、临床诊疗等。

虚拟数字人的定义:本文中所分析的虚拟数字人是指具有数字化外形的虚拟人物。与具备实体的机器人不同,虚拟数字人依赖显示设备存在,并且拥有类人的生理构造(模仿人的形象、肢体构造)、人的行为(能说话、能运动)以及人的思想(基本的逻辑能力、并可以出输出内容如书写、与人交谈)。

虚拟数字人的分类

•按技术分类:虚拟人可分为算法驱动型(AI实时或捏脸等)和真人驱动型(动作捕捉);

•按视觉维度分类:虚拟人可分为2D型和3D型;

•按结构组成分类:虚拟人可分为数字型(用户线上观看)和全息型(用户现场裸眼观看);

•按核心功能分类:虚拟人可分为服务型和身份型。

真人驱动型VS 算法驱动型

根据驱动方式的不同,虚拟数字人可分为真人驱动型和算法驱动型,后者是近年来多模态技术和深度学习技术发展的集大成者。

•真人驱动型:通过真人(俗称皮套人、中之人)来驱动数字人,主要原理是真人根据视频监控系统传来的用户视频,与用户实时语音,同时通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象上,从而与用户进行交互。它生成的往往是一个静态模型,在绑定关键点之后,需要借助真人通过动作捕捉设备进行形体、眼神、动作等的捕捉,然后才能进行驱动和渲染。当前关注度较高的真人驱动型虚拟数字人主要有Siren(来自腾讯)、A-SOUL女团(来自乐华娱乐字节跳动)、VIVI子涵(来自京东)等。

•算法驱动型:通过智能系统自动读取并解析识别外界输入信息,根据解析结果决策虚拟数字人后续的输出文本,然后驱动人物模型生成相应的语音与动作来使虚拟数字人跟用户互动。该人物模型是预先通过AI技术训练得到的,可通过文本驱动生成语音和对应动画。它是基于深度学习模型的三维场景表达和对应的神经渲染管线,可以自驱动学习模特说话时的唇动、表情、语音以及姿态和动作等。当前关注度较高的算法驱动型虚拟数字人主要有华智冰(来自智源研究院、智谱AI、小冰公司)、洛天依(来自Yamaha)、柳夜熙(来自创壹科技)等。

服务型VS 身份型

根据核心功能以及应用场景的不同,虚拟数字人可分为服务型和身份型。其中:

•服务型虚拟数字人:可提供服务而具备功能性,可替代真人完成任务或提供日常陪伴、关怀等服务,如虚拟主播、虚拟老师、虚拟陪伴助手等;

•身份型虚拟数字人:与缺乏人格象征的服务型虚拟数字人相比,身份型虚拟数字人具备鲜明身份性,可用于娱乐/社交等场合,如虚拟IP/偶像、虚拟世界第二分身。虚拟IP在现实世界中并不存在对应的真人,其外貌特征、基本人设、各类偏好、背景信息等均由人为设定。在虚拟IP领域,大多会采用真人驱动的方式进行运营,但对应的真人演员与虚拟IP本身并无强绑定关系。

中国虚拟数字人行业制作流程

(一)三大主要环节

虚拟数字人的制作流程涵盖了诸多技术,制作方式与制作技术仍在不断进化中。虚拟人制作流程中最为核心、最具挑战的是建模、驱动、渲染三大流程。

•建模环节:以真人为模型或设计人物为虚拟数字人建立基本的3D模型。3D 建模为构建虚拟人形象的基础,重点在于实现细节的精细还原;

•驱动环节:通过真人动作捕捉(真人驱动型)、训练驱动模型(算法驱动型)等形式确定虚拟数字人的基本动作;

•渲染环节:根据在设计环节中确定的虚拟人最终呈现效果和应用场景等外界要素,将模型与其运动进行渲染以呈现最佳效果。渲染技术用于提升虚拟人的逼真程度,实时互动亦需要实现实时渲染

中国虚拟数字人行业核心技术

(一)建模:精度可达毫秒级

目前虚拟数字人的扫描建模技术可分为静态重建和动态光场重建两大类,其中静态扫描处于主流地位应用广泛,而高保真动态光场三维重建技术初露锋芒,是未来建模技术发展的重要方向。

静态建模技术

结构光扫描重建:早期的静态建模技术以结构光扫描重建为主,但其扫描时间长,对人体运动目标的友好度和适应性不佳,因而更多应用于工业生产、检测领域。

•拍照式相机阵列扫描重建:近年来得到飞速发展,目前可实现毫秒级高速拍照扫描(高性能的相机阵列精度可达到亚毫米级),满足数字人扫描重建需求,成为当前人物建模主流方式。

动态光场重建技术

相比静态建模技术,动态光场重建不仅可以重建人物的几何模型,还可一次性获取动态的人物模型数据,并高品质重现不同视角下观看人体的光影效果,成为虚拟数字人建模重点发展方向。动态光场重建是目前世界上最新的深度扫描技术,此技术可忽略材质,直接采集三维世界的光线,然后实时渲染出真实的动态表演者模型,它主要包含人体动态三维重建和光场成像两部分。

中国虚拟数字人行业应用价值

人机交互到人人交互

随着AI技术的成熟、5G网络的普及以及虚拟现实终端的应用,人机交互方式从最早PC时代的键盘鼠标交互,到目前的移动终端app交互,过渡到自然语言的AI交互。同时由于虚拟数字人真实性、高效性、情感性特点,代表着人机交互新范式——人人交互,使得超写实虚拟数字人与真人进行实时面对面交互成为现实。

•真实性:虚拟数字人最重要的价值是给用户提供了一种更真实的交互方式。通过将计算机视觉语音识别自然语言处理等AI技术深度融合,充分模拟人与人之间真实可感的对话交互方式,达到听得懂,看得见,说得出的效果。

•高效性:从交互效率来看,借助手机大屏等屏幕载体,虚拟数字人不仅能呈现图表文等语音和文本机器人无法展示的多媒体信息,让信息传达更加丰富准确;输出线上、线下高频次的互动或运营内容;高效一体化完成身份识别、手势识别情感识别等多种交互任务。

•情感性:可视化的真实形象赋予了数字人独特的情感属性,真人形象带来的服务温度和视觉情感收益有助于建立人性化的情感纽带。尤其是针对独居老人留守儿童这类需要陪伴的群体;亦或是可以建立情感纽带的虚拟偶像、虚拟IP等。

中国虚拟数字人行业应用场景

(一)影视动画:数字替身

虚拟数字人+影视已实现成熟应用,产品广受市场认可,国内关于特效影视的相关扶持政策密集出台,数字替身正展现广阔的市场前景。数字替身特效可以帮助导演实现现实拍摄中无法表现的内容和效果,已成为特效商业大片拍摄中的主流技术手段和重要卖点。近年来中国影视数字人特效取得快速发展,部分特效大片获得市场认可。《刺杀小说家》是国内首次在全片应用动态虚拟化拍摄系统的电影,电影中赤发鬼便为虚拟人。2021年在全球TOP20票房影片中,有13部使用了大量特效技术,2部动画电影。此外,继国内多个主流卫视频道的跨年晚会后,虚拟人技术再次在北京卫视、安徽卫视江苏卫视春晚的节目中得到应用。

中国虚拟数字人行业产业链

技术日益成熟,产业不断丰富

当前虚拟数字人理论和技术日益成熟,应用范围不断扩大,产业正在逐步形成、不断丰富,目前已经发展出了由技术层、平台层、应用层组成的产业链结构。

•上游技术层:为虚拟人的生产制作提供技术支持,主要可分为硬件部分和软件部分。硬件包括所有虚拟人呈现及交互所需的硬件,如显示设备、芯片和交互所用的光学器件、传感器等,以及制作虚拟人时需要承载算力的计算设备、动作捕捉所用的各类光学器件以及动作传感器等。软件端除了呈现和交互软件外,在制作环节还需要建模软件和渲染引擎;基础层的厂商主要在海外,已深耕行业多年并形成了较为深厚的技术壁垒。

•中游平台层:将上游中各独立技术进行串联,应用在具体的项目设计中,主要包括建模、动捕、渲染等制作环节。平台层公司目前在高速发展中,竞争壁垒主要在如何结合技术能力和文化设计能力,为下游应用层提供整合的虚拟人解决方案。随着AI、算法、5G网络等技术发展,制作环节成本仍有下降空间。

•下游应用层:将虚拟人应用于各行业领域。虚拟人相关技术首先在影视、传媒和游戏领域有了多年应用的积累,随着技术进一步成熟正逐步呈现出新的赋能方式。目前在金融、文旅等领域,虚拟人凭借其与AI技术的结合,以及成本、表现力优势逐步开始提供数字员工、虚拟导游等服务。

中国虚拟数字人行业商业模式

虚拟偶像的商业变现模式

虚拟偶像是当前国内各大互联网平台争相打造的虚拟数字人形象,相比真实偶像,虚拟偶像具有确定性强、无负面新闻、永不塌房的特点,未来将对真人偶像产生一定冲击。目前国内的虚拟偶像的商业变现以直播带货、打赏及代言为主流。

•收入端:目前虚拟偶像创造的收入主要来自营销端(代言、直播带货等)、形象端(商演、直播打赏、影视剧参演等)、声音端(歌曲、MV发售)、衍生品(游戏、动画、手办模型等);

•成本端:根据蓝色光标的《元宇宙营销工作手册》,当前技术水平下设计一个虚拟偶像形象花费10-100万元,且后续的内容制作和智能驱动研发还需持续投入,动态虚拟数字人直播或者视频制作的数据/渲染等对技术/算力要求较高;此外优秀的原创内容是虚拟偶像的主要竞争壁垒,如果拥有专业运营团队支持,运营人力成本较高。以虚拟偶像短频产品来看,一条普通的短视频成本大约在几千元甚至上万元,数分钟的定制视频的成本则需要花费数万元乃至十几万元。

中国虚拟数字人行业市场规模

人工智能产业热度不减

•全球人工智能渗透率逐年提升。依图科技招股说明书公开数据显示,全球人工智能产业市场规模逐年增长,预计2022年全球人工智能市场规模将超过3,500亿美元,同比增长率超25%。随着全球各国人工智能技术的进步与应用渗透率的不断提升,预计未来五年全球人工智能产业市场规模将继续保持高速增长态势。

•中国人工智能市场增长位居世界前列。2017年国务院印发了《新一代人工智能发展规划》,将人工智能上升到国家战略层面,得益于国家政策的引导,近年来,我国人工智能发展进程位居世界前列。据德勤公开数据显示,预计2022年我国人工智能市场规模近2,700亿元,同比增长超过30%。

中国虚拟数字人行业竞争格局

海外巨头技术优势明显

海外巨头聚焦于虚拟数字人的基础建设。虚拟数字人产业链的基础层主要是技术壁垒深厚的海外巨头,典型代表如英伟达、EpicGames、Unity均基于自身技术优势向下游生产技术服务平台延伸。国内领先企业更侧重AI技术的开发与内容应用。国内领先企业更多的是自研AI系统并探索虚拟数字人在社交活动、新闻媒体、文旅等领域的应用,不断涌现大量新锐企业,如万像科技、次世文化专注于虚拟偶像的孵化与运营。

中国虚拟数字人行业政策法规

虚拟现实相关产业备受关注

2016年是虚拟现实产业元年。自2016年起,国家发布多项政策支持我国虚拟现实产业发展,并将虚拟现实和增强现实与云计算大数据、物联网、工业互联网区块链、人工智能一起列为数字经济重点产业。虚拟数字人作为虚拟现实产业重要的应用之一,有望享受政策利好带来的红利释放期,应用场景不断由ToB端更多的向ToC端拓展。

中国虚拟数字人行业企业介绍

百度:智能云曦灵平台

百度在虚拟数字人领域着重研发AI技术,通过全栈的AI能力,搭建百度智能云曦灵-智能数字人平台,提供虚拟主播直播解决方案,实现端到端软硬一体的商业应用。

阿里:致力于电商直播智能化

阿里在虚拟数字人领域主要致力于推动电商直播智能化。目前阿里的虚拟数字人有两款产品:虚拟数字人开放平台、品牌智能直播间,其中虚拟数字人开放平台正在公测阶段,品牌智能直播间目前进入商业化阶段。

腾讯:IP虚拟人赋能众多行业

腾讯入局虚拟人赛道有两个优势:(1)腾讯旗下的游戏IP为虚拟人的制作提供了大量的素材;(2)旗下NExTStudios、腾讯云和AI Lab深入研究虚拟人制作技术和AI技术。

网易伏羲:游戏与泛娱乐AI

网易伏羲是国内专业从事游戏与泛娱乐AI研究和应用的顶尖机构。网易伏羲的研究方向包括强化学习、图像动作、虚拟人、自然语言、用户画像、大数据和云计算平台等,已拥有数字人、智能捏脸、AI创作、AI反外挂、AI对战匹配、AI竞技机器人等多项行业领先技术。通过人工智能技术在游戏、文娱、文旅等产业中的应用,全面释放创作者的生产力,革新用户体验,丰富每个人的精神世界。

科大讯飞:AI虚拟人平台

科大讯飞是亚太地区知名的智能语音和人工智能上市企业。自成立以来,一直从事智能语音、自然语言理解、计算机视觉等核心技术研究并保持了国际前沿技术水平;积极推动人工智能产品和行业应用落地,致力让机器能听会说,能理解会思考,用人工智能建设美好世界。

可点击下方行行查链接查看报告全文

欢迎评论、点赞、收藏和转发! 有任何喜欢的行业和话题也可以私信我们。