虚拟数字人开发平台深度评测,做虚拟人哪家强?
本文由 @WeekHub 原创发布于人人都是产品经理
2023年AIGC真的是火出了圈,尤其是ChatGPT的爆火,AI生成式算法的突破,不夸张的讲技术圈每天一个新产品、新变化,看麻木了。另外,数字人跻身于元宇宙和AIGC两大风口中心,再次成了创投圈瞩目的焦点。
ChatGPT在数字人的智能交互性、实现个性化服务上、数字人的表现形式上以及商业化价值上等都一定程度上赋能了虚拟数字人,为数字产业和应用提供新的发展机遇和前景。而数字人作为作为元宇宙的最核心要素,或可能真正打开元宇宙。有人的地方就有江湖,有人的地方就有交易。
什么是虚拟数字人?目前流行的解释:虚拟数字人指存在于非物理世界中,由计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用,并具有多重人类特征(外貌特征、人类表演能力、人类交互能力等)的综合产物。市面上也多将其称为虚拟形象、虚拟人、数字人等,代表性的细分应用包括虚拟助手、虚拟客服、虚拟偶像/主播等。
虚拟数字人的三大特征:形象能力、表达能力和感知互动能力。形象能力,即虚拟数字人拥有人的外观,具有特定的相貌、性别和性格等人物特征;表达能力,即虚拟数字人拥有人的行为,具有用语言、面部表情和肢体动作表达的能力;感知互动能力,即虚拟数字人拥有人的思想,具有识别外界环境、并能与人交流互动的能力。
毋庸置疑,虚拟数字人是个真需求,但目前的产业生态是否能支撑这个需求?它真的做到降本增效吗?移动互联网什么时候能因为数字人而转向?
当前虚拟人已涵盖影视、传媒、金融、文旅、房地产、汽车以及银行证券等多场景。相信不少人也是尝鲜过数字人产品了,身边也有一些朋友做数字人直播带货,当然大部分人只是尝鲜,放弃使用是常态,考虑到成本效果等毕竟目前还是处于一个尴尬的过渡期。不过AI生成式算法的突破,将大幅提升虚拟人的语意理解能力和用户沟通能力,不同领域应用虚拟人自动化水平将得到提升。
作者这里主要从数字人市场背景、竞品核心功能以及运营策略盈利模式几个角度来浅聊一下数字人产品这个充满希望又充满未知的物种,毕竟喜欢新鲜事物的我还是非常看好的。选择的竞品分别是腾讯智影、WarpEngine、D-ID以及HeyGen,这四款产品既有国内外,又有大小公司,以此来展开聊聊。
先看一波百度、抖音和微信的搜索指数,微信最近倒是高了一波。
一、市场背景
据艾媒咨询报告,在市场规模上,2022年中国虚拟人带动产业市场规模和核心市场规模分别为1866.1亿元和120.8亿元,预计2025年分别达到6402.7亿元和480.6亿元,呈现强劲的增长态势。随着娱乐需求的增加,AI等技术不断迭代的环境下,中国虚拟人产业高速发展,元宇宙的热潮加速推动虚拟人产业升级。
用户调研数据显示,中国受访者对虚拟人的知晓度达88.0%,常接触到的虚拟人类型有虚拟员工、虚拟偶像以及虚拟主播三种,其中虚拟主播的受众最为广泛达64.1%。虚拟人的应用已逐渐突破次元壁,虚拟和现实之间的相互交织,为市场开辟了一块属于虚拟生态的空间,虚拟文化也开始被大众接受。
二、从宏观环境(PEST)来看虚拟数字人
1. Politics
国家在大力鼓励和支持新兴文化业态,发展文化产业,推动数字文化与相关新兴产业相互融合。虚拟数字人作为数字文化产业和网络直播的综合产物,是未来建设社会文化强国战略目标的重要推动力。今年也推出了相关政策。
另外,2022年上半年北京市经济和信息化局印发了《北京市促进数字人产业创新发展行动计划(2022-2025年)》,发展目标指出到2025年数字人产业规模突破500亿元,这是国内首个虚拟数字人专项政策。
2. Economy
艾瑞咨询数据显示,2022年中国数字经济规模约为50亿元行业带来发展契机。
另外,陀螺研究院的《2023年全球虚拟数字人产业报告》统计,2020年至2022年期间,全球虚拟数字人企业数量同比增长2.7倍,投融资事件从12起增加至44起,投融资总规模从1.65亿元扩大至49.88亿元,投融资总规模同比增长超29被,其中最大的一笔投资,是来自2021年韩国元宇宙虚拟社交平台ZEPETO,融资金额达12.1亿元。
3. Society
数字文化产业逐步成为中国文化产业发展的新增长点,2022年中国文化企业实现营收121805亿元,比上年增长0.9%。全国文化及相关产业增加值自2016年以来总体呈稳步增长趋势,增长速率与2021年已基本回到疫情前水平。2022年中国人均教育文化娱乐消费支出2469元,占总消费支出的10.1%。
数据显示,2020年到2022年,中国网民规模呈现逐渐增长趋势,其中网络直播用户增长趋势显著,截止2022年12月,网络直播用户已达7.51亿人,占网民总人数的70.3%,其中网络虚拟主播行业在近几年随着技术的发展成为直播领域中成长最快的市场。元宇宙概念的火热,Z时代的兴起,吸引了更多的资本进入虚拟主播行业,用户和从业者规模将进一步扩大。
(以上数据来源:中国互联网信息中心,艾媒数据中心 (data.iimedia.cn))
4. Technology
虚拟数字人产业的发展涉及到众多技术领域,涵盖 AI 技术、RPA、云计算、大数据、物联网、5G等。新冠疫情也加速了产业的发展和应用。
虚拟数字人的概念也是不断随着技术的发展迭代更新的。初期,受到技术限制,人设崩坏、画面难看等被用户诟病,用户体验极差。不过这两年无论是CG、动捕、AI等技术不断革新,虚拟数字人视觉体验和制作更加成熟完美了。5G的大规模发展也给虚拟人更优的支撑。
2022年11月OpenAI发布ChatGPT之后,生成式AI更是一路高歌。国内百度的文心一言、阿里的通义千问等产品不断更新迭代,自然语言生成技术加速提升了数字人智能化水平,应用于不同领域发挥其效果已经一个必然事件。目前,24小时直播带货已经初见端倪。
生成式AI这样的大语言模型能助力数字人的一些优势比如:
提高虚拟人的对话质量,虚拟人的回答会更加自然、准确。
更符合人类沟通的习惯;
改善用户体验,可以帮助虚拟人更好地融入用户的生活,提供更加舒适的用户体验;
扩宽应用领域,可以开发各种各样的人工智能虚拟人,用于不同领域的应用;
提高自动化水平,大语言模型可以自动化生成自然语言文本,使得虚拟人变得更加智能化。
数据显示,截止2022年末中国人工智能企业数量接近4000家,核心产业规模(增加值)达到5080亿元。
既然PEST都分析完了,那也不能少了SWOT。
三、SWOT 看虚拟数字人
优势(Strengths):
技术领先:
虚拟数字人基于人工智能、虚拟现实、增强现实等技术,非常智能和逼真,用户体验和服务也很好,且虚拟数字人的技术还在不断更新和创新,未来市场前景很广阔。
应用场景广泛:
虚拟数字人可以应用于游戏、虚拟社交、数字娱乐、医疗、教育、工业等多个领域,随着虚拟数字人应用场景的不断增多,虚拟数字人将会有更多的机会得到市场认可。
可定制性强:
虚拟数字人可以根据用户需求进行定制,可以为用户提供更个性化、更符合用户需求的服务,同时,虚拟数字人也可以根据不同场景的需求进行定制,可在不同场景中发挥更大的应用效果。
可重复使用性强:
虚拟数字人可以实现多次使用,不会像传统的人力资源一样有限制,可以大大降低企业的成本和人力资源的压力,对企业发展具有重要的意义。
劣势(Weaknesses):
技术风险:
虚拟数字人的技术比较复杂,需要多种技术进行整合和协调,技术的不稳定性和风险性比较大,如果技术出现问题可能会给企业造成损失。
商业模式不确定:
虚拟数字人的商业模式还处于探索阶段,未来的市场前景和商业价值还存在不确定性,这也是虚拟数字人在市场中发展面临的挑战之一。
需求不确定:
虚拟数字人作为一种新兴产品,目前市场的需求还不是很明确,需要企业加大市场调研和产品定位,了解用户需求和市场变化,及时调整和改进产品,满足市场需求。
机会(Opportunities):
趋势利好:
虚拟数字人受到政府和市场的支持和关注,是数字经济发展的重要方向之一,未来市场前景和商业价值非常巨大,为企业发展提供了很好的机会。
应用场景的不断扩展:
虚拟数字人可以应用于游戏、虚拟社交、数字娱乐、医疗、教育、工业等多个领域,这些领域中的应用场景也在不断扩大,随着虚拟数字人应用场景的不断增多,虚拟数字人将会有更多的机会得到市场认可。
新兴市场:
虚拟数字人市场规模和增长趋势非常明显,预计到2025年将达到94.3亿美元,复合年增长率达到36.5%,这表明虚拟数字人具有巨大的市场潜力和商业机会。
威胁(Threats):
市场竞争:
随着虚拟数字人市场的不断扩大,已经有不少大型互联网公司、虚拟现实技术企业等在该领域投入巨资并开展相关业务,未来市场竞争将会更加激烈。
法律风险:
虚拟数字人作为一种新兴技术和产品,相关法律法规还不完善,存在法律风险,需要企业关注并积极应对。
技术风险:
虚拟数字人技术本身就存在风险,如果技术存在缺陷或漏洞,可能会造成用户数据泄露或其他损失,需要企业加强技术研发和安全保障,以保证用户权益和企业信誉。
总体来说,虚拟数字人作为一种新兴技术和产品,具有很多机会和潜力,但同时也存在不少挑战和风险。企业需要加强技术研发和安全保障,了解市场需求和用户需求,探索和完善商业模式和盈利模式,以提升自身在虚拟数字人市场中的竞争力,获得更好的市场发展和商业回报。
(是的,你没有看错,SWOT这么套路的废话一看就是ChatGPT写的)
四、竞品浅析
虚拟数字人发展至今,诞生过不少IP,比如国内首个虚拟歌姬洛天依、讯飞的Luya、百度的度晓晓、元圆科技的天妤、阅文集团的叶修…..,相关的公司也一大堆。这都是特定角色,这篇文章只浅浅聊下作者在自媒体圈里有体验过的数字人制作平台:腾讯智影、D-ID、HeyGen、WarpEngine。
由于这里关心的是用户对产品的使用,所以主要从和数字人相关的核心功能和运营策略以及盈利模式浅聊一下,毕竟除了核心技术,运营赚钱能力可谓是非常重要了。其他如产品体验、用户画像等这些就不分析了。
1. 腾讯智影
产品slogan:腾讯智影是一个集素材搜集、视频剪辑、后期包装、渲染导出和发布于一体的在线剪辑平台,能够为用户提供从端到端的一站式视频剪辑及制作服务。
核心功能:
目前,腾讯智影(zenvideo)功能也比较多,各种智能小工具,这里只看下数字人播放这个核心功能,粗整理一下他的能力。
从他的能力上来看,就是视频编辑和数字人编辑两个大方面,视频编辑的能力是常规,当然集成到数字人视频里确实也蛮强大了。数字人编辑的形象和动作目前是给定的,每个人物都对应特定形象,虽然给了展示,但目前还不允许编辑。数字人只有合成之后才能看到动态的视频,合成之前的数字人是静态的,受限于目前的技术。有文本和音频两种合成数字人的方式,从技术经验来看,这两种方式相辅相成,一定是同时出现的。
最关心的就是数字人的姿态和表现。会员可以使用的那些数字人效果还不错,除了脸部头部唇形,还有手势的一个变化。唇形的效果和数字人角色相关,有些还是不太行,不过有的数字人还是很不错的。
另外,关于AIGC方面的另一些能力,文章转视频可以实现文本自动生成,然后匹配数字人进行播报。前两个月推出配套的智影小程序也集成了AI绘画的能力,不过网页版暂时没有实现这个能力。
运营策略 & 盈利模式:
就看最基本的 AARRR 模型(Acquisition(获取)、Activation(激活)、Retention(留存)、Revenue(变现)和Referral(推荐))
先贴图
拉新:
外部推广,腾讯其他产品给的流量,毕竟这是腾讯的呀;
邀请好友送会员,每邀请一人注册得1000金币,每满5人注册额外获得一个月高级会员,被邀请用户中每有1人购买会员,可获得与其相同等级会员1个月;
合成的视频,都会有分享按钮,支持链接分享和扫码分享;
留存:
新用户注册享受3天超级会员权限(长时间没登陆老用户也送);
有新手入门教程,带用户了解核心功能,并引导完成一些关键行为。
促活:
小程序的AI绘画和数字人功能,也给网站带来了活跃度;
微信公众号发布相关信息;
还有微信社群运营,我目前加了群,显示已经到第六十多了;
(也是Referral了)
转化:
目前的盈利模式也都比较明显,无论是C端用户还是B端,都是会员制收费。另外还有企业定制,代理商合作。
总之,盈利模式:会员 + 企业定制 + 代理商合作
2. WarpEngine
产品 slogan:仅需20分钟视频,跃迁引擎即可为您制作突破自身语言、表演、时间、空间极限的超级分身。
核心功能:
Warpengine把视频制作和分身定制分开作为两部分。制作视频的方式有几种:pdf上传、从模板制作、直接制作,这几种到其实没太多差别,只是素材来源不一样。另外一个是创意站,这里面两种是一键生成视频和趣味视频。
视频制作方面,提供了基本的内容元素编辑功能。数字人只能选择官方提供,音色不多,且目前看上去只支持中文。创意站里风格就多了,一键生成视频里边给的一些选项也是对标商品宣传来的,足见针对的目标群体还是很明确的。通过一些关键词,然后自动生成数字人视频,GPT集成还挺好,没看到自定义文案,难道只能和普通创建视频分开?貌似也不用。同样创意视频里也集成了AI绘画生成头像的能力,可以提供文本或音频,这里的文本也是自定义,不过这里的头像可以支持上传。最关心的数字人能力如何?好用!脸部姿势和唇形效果都不错,不过目前只有半身数字人。
可以看到,目前是集成了一些AIGC的能力,虽然不够完善,但基本功能都有了。从官方给的版本迭代信息来看,上线迭代总共不到两月。前面给的分身定制场景对话的能力暂时还没看到,应该是下一步会有的能力,这个很期待。
运营策略 & 盈利模式:
先上图
拉新:
最主要的一个动作就是在微信里分享视频,不单纯只有链接
留存:
新用户注册享受3mins使用时长;
网站进去,就有新手教程步骤,指导关键行动;
视频分享之后还提供数据服务。
促活:
公众号(目前是有视频没有图文)、视频号,发布相关视频。
盈利模式:
warpengine做的是按使用时长收费,只有10min和30min套餐,算下来8-10块钱一分钟。另外一种就是企业定制。包括一些核心功能信息展示整个看上去还是更倾向于B端用户。API也是包含在时常套餐里的,所以主要就是套餐费用+企业定制
3. D-ID
产品slogan:Create and interact with talking avatars at the touch of a button, to increase engagement and reduce costs.
核心功能:
D-ID是国外的一款数字人产品,很简洁,就两个功能,一个是数字人视频制作,一个是数字人聊天。另外,他提供了接口供开发人员使用。
D-id chat 号称是第一个使用 ChatGPT 实现面对面对话的应用程序,只能免费使用40次,数字人头像目前不能更换。唇形看上去效果一般,头部姿态也一般。音色是OK的,后端调用的是微软的音色库。
头像支持自己上传符合条件的图片,也可以使用素材库里的图片,还可以用AI绘画生成。这几个方式算是很优秀了。语言支持很多种,各个国家都有,还有多样音色和风格可以选。试下来中文输出唇形还是一般般,英文还是不错的。
使用上还是简洁明了,不过国外的产品对中文和头像总归还是有些差别。另外,值得一提的是开放接口给开发人员使用,这也能看出来他的产品定位。
运营策略 & 盈利模式:
这款产品没看到多少营销运营的策略,感情就是靠产品自然生长?
不过盈利模式还算清晰:会员 + 企业定制 + 第三方开发使用
提供了五种付费策略:Trial、Lite、Pro、Advance、Enterprise,整个看下来,除了贵还是贵。
4. HeyGen
产品slogan:The best AI video generation platform for your team
核心功能:
HeyGen创建数字人有4种方式:
从URL创建:
只支持亚马逊商品链接一键创建视频,做商品介绍。
已有项目编辑
从模板创建:
提供了各种类型的模版
从 avatar 创建:
选择数字人编辑
创建视频之后,一些核心内容如:数字人编辑、文本上传编辑生成、声音编辑、视频编辑等。数字人支持上传图像,支持AI绘画生成,也可以直接选择素材库里的avatar三种方式,点击数字人图像也可以作为图层做一些编辑操作。。文本可以直接输入,也可以使用ChatGPT生成脚本,当然支持直接上传声音。视频编辑可以增删改处理其他各种元素,还能上传PPT和PDF文件用来生成视频内容。
包括音视频数字人的生成编辑功能是很齐全的了。来看下最关心的数字人效果,但只有头像的也有半身数字人,体验下来,无论中文还是英文,头部姿势包括手势身型,还有最重要的唇形都已经非常逼真了,官方给的宣传视频和模板里的数字人非常优秀,自己上传的略差一些。
运营策略 & 盈利模式:
还是先上图
拉新:
YouTube 看到官方有宣传视频,他所有视频都是放在YouTube上;
每邀请一个人注册都会送 1min credit,每个月上限10 min;
无处不在的分享按钮,可以链接分享。
留存:
新用户注册享受 1 min credit;
主页进来就有新手入门教程,带用户了解核心功能;
支付页面有关于支付的FAQs。
促活:
支付页面有各种用户使用的推荐语;
每个月都送 credit;
在Twitter、FaceBook 等平台有自己的社区。
盈利模式:
除了 Free,会员有两种模式,Essential 和 Pro,每种模式都可以选择对应的时长支付相应的价格。还有就是企业定制。API是包含在Pro里,只给会员使用。
所以,目前看上去盈利模式就是:会员 + 企业定制
五、四种数字人产品的SWOT比较
从产品的 slogan、核心功能以及运营模式可以简单看到一些区别优劣,整理总结如下。
以上不够全面,缺的读者自己补上。抛开技术能力不说,整体的方向就是视频编辑、融合AIGC、数字人定制化、数字人对话这些,产品目前没有很全面的,都还属于探索期,距离成熟期还很遥远。
以上四种最好的就属heygen了,也是给其他的产品提供了思路和方向,智影的定位更偏向于一个视频制作软件,加上丰富的素材,做服务提供商是方向。d-id虽然功能单一,但如果专精数字人视频和对话的话未来提供技术服务有望。warpengine虽然不够完善,但属于刚诞生的产品,国内还是有优势,值得期待。
六、最后的话
作为一个很吃技术的科技行业,无论是创投圈还是普通人,都看好,但如何才能入局?降低风险?也是一个需要思考的问题。
发展上来讲,政策也是越来越完善,产品或者创业环境还是相对不错。今年生成式AI技术更是给数字人发展提供了加速度。另外其他行业的发展也促进了更大的市场需求,而且用户接受度也在增加,商业的尽头是带货,数字人是重头戏。
回到标题上,我想诸君自有答案。
最后几个思考:
未来数字人产品一定会同质化,这个局怎么解?
整个产业链其实不不够完善,成本就高,产品端有没有办法降本?
(明显的废话)
数字人假如真的用起来了,千篇一律的形式,用户不买账,产品还能活下去吗?
怎么破?
话说中型企业一定要足够细分领域,创新创新再创新才可能成为那 1%,但这数字人赛道小企业有机会胜出巨头吗?
(靠服务靠运营?
,可以肯定的是不懂娱乐社交不懂运营一定没戏)
最后一个思考,普通人如何入局数字人,如何入局 AIGC?
注,本文内容仅以一个用户的角度来看,或有不符合实际产品定位等情况,请自行甄别。
往期推荐
-
上一篇
爱优腾集体抨击短视频:腾讯副总裁猛批低智洗脑短视频是猪食,优酷总裁希望B站做原创,爱奇艺称二创是盗版…
-
下一篇
虚拟数字人训练系统可以制作大量的视频,用户可以通过观看这些视频,学习沟通技巧、表达能力等等方面的知识和技能。
形象声音定制
虚拟数字人形象声音定制是在数字人形象初阶段的制作,即给数字人物设置正确的身姿、动作及各个标签名称、功能点等,在全部输入完成后,即可对其进行形象、声音的修改调制以及各种生动化细节上的优化,从而形成一个更加自然生动、可行性更加高的虚拟数字人。用户可以根据自己的需要,定制虚拟数字人的形象和声音,使其更贴合用户的需求。也可以选择不同的语音、口音等,使虚拟数字人更贴合自己或特定的情境。
互动训练
虚拟数字人训练系统