新一轮竞赛,ChatGPT:全球商业化落地加速,新一轮算力储备开启
01 本周回顾:上涨趋势延续,行情演绎 五重击
本周计算机指数上涨0.47%,跑赢沪深300指数1.32pct,在31个申万一级行业中涨幅排名11,年初至今计算机涨幅排名1。
2023年1月制造业PMI企稳回升,经济迎来开门红,同时扩大内需、数据要素流转、数据安全等纲领性政策均对创新科技的发展提供了长期驱动力;2022年底推出的AI聊天机器人ChatGPT火速出圈,开启AI新纪元,有望迎来商业化大潮。
计算机板块第一阶段的N字第三笔延续,行情演绎五重击:
第一击:收入成本剪刀差,利润弹性逐季拔;
第二击:PE估值处于历史低位,当期分位数实乃虚高;
第三击:基金持仓低,横向景气度高,资金搬家忙;
第四击:ChatGPT开启AI新纪元,科技创新周期上行加速,产业底层症结有望化解;
第五击:政策主线托底,百花齐放可期。
财通证券年度策略里提出的百花齐放正持续验证,全年核心主线依然是我们反复强调的泛信创、泛安全、硬科技这一产业主航道,逐步加大顺周期的工业智能化/工业软件等赛道的配置。
02 大模型路径成为AI产业的内生选择
AI大模型方法驱使生成式AI走向成熟,引领AI大规模商业化落地。AI模型可大致分为决策式/分析式AI、生成式AI两大类,决策式AI已在推荐系统、计算机视觉、自然语言处理领域实现应用,生成式AI在大模型的驱动下逐渐发展成熟。
AI大模型方法或许并不是通向强人工智能的终极解决方案,但为AI技术进一步突破以及产业化落地指明了方向。
在过去几年中,AI大模型方法逐步成为行业的主流共识,主要原因基于以下四个方面:
业界逐步认识到大模型更加适合于生成式AI。之前参数量较小、结构简单的小模型更受欢迎,一方面是因为小模型对硬件的要求较低;另一方面是具有更高的可解释性和稳健性。但对于执行比较复杂的创新型任务,具有大量参数的大模型更为优越。
最近发展的新模型结构,降低了大模型的训练成本。2017年推出的Transformer可以实现更好的并行性,并可以大幅度缩短训练时间。
软硬件能力进步,为大模型提供了算力支撑。随着软件升级以及AI芯片技术突破,算力获得指数级增长,训练大型生成式AI成为可能。
多模数据不断丰富,为模型训练提供基础。要训练出大型生成式AI,需要投入充分的初始数据。随着移动互联网的发展,大量的文字、图片以及视频等多模数据都可以用于生成式AI训练。
处于Gartner曲线期望膨胀期以及复苏爬坡期的技术要素协同共振,ChatGPT商业化快速落地可期。
根据2022年Gartner提出的AI技术曲线,大模型与生成式AI处于期望膨胀期,数据标注与智能应用处于复苏爬坡期,ChatGPT正是处于新兴技术应用展望与成熟技术落地爬升的阶段,因此获得资本市场与AI产业极高的关注度,有望于2023年快速实现垂直行业的商业化落地。
03 百舸争流:全球开启新一轮AI竞赛
全球科技巨头开启新一轮AI竞赛。自2017年谷歌提出Transformer模型后,大模型技术引领AI发展趋势,全球科技巨头围绕生成式AI大模型开启新一轮竞赛。
大模型训练效果受到数据、算力、算法多方面影响,其竞争实质上比拼的是国家智能化综合实力,因此在中美两大AI强国诞生了众多算法模型。
以OpenAI为例,2018-2020年陆续推出GPT、GPT-2、GPT-3,参数分别为1.17亿、15亿、1750亿个,模型体量呈现指数级增长。
当前中美两国都已研发出上万亿参数的模型,随着模型体量持续增大,海量数据、大规模算力等资源将成为主要壁垒,在ChatGPT的加持下,全球科技巨头有望快速加码AI赛道的投入。
国内外科技巨头近期动作频繁,积极应对ChatGPT带来的行业变革。ChatGPT一经面世,激起千层浪,科技巨头均已加速布局。
为对标ChatGPT,谷歌已明确表示正在开发一项名为Bard的对话式人工智能服务项目,百度正式宣布了大模型项目文心一言,360计划推出类ChatGPT技术的Demo版产品,阿里宣布正研发阿里版ChatGPT,各大巨头纷纷参与其中,形成百舸争流之势。
04 行业变革:AI商用化落地场景或将百花齐放
4.1 生成式AI:叠加数据要素流转,构建全新产业形态
AI商用化将构建全新的计算机产业生态。
AI模型训练需要消耗大量数据与算力资源:
(1)数据采集和标注来源于自有AI数据团队以及第三方AI基础数据服务商。随着大模型持续优化,高质量、高效、专业化数据标注需求持续扩张,将带动基础数据服务行业蓬勃发展;
(2)大模型对算力基础设施要求提升。
根据OpenAI,从2012年开始,AI训练所用的计算量呈现指数增长,平均每3.43个月便会翻倍,至2018年AI计算量扩大了30万倍。随着数据要素流转逐步落地,AI算法公司与垂直行业之间的行业数据交易、AI产品服务将形成产业闭环,加速AI商用赋能全行业。
4.2 全行业赋能,商业化大潮将涌现
4.2.1 文本生成
微软旗下所有产品将全线整合ChatGPT。继微软宣布在搜索引擎BING、办公全家桶Office嵌入当今最火的语言模型ChatGPT后,CEO纳德拉宣布还将在云计算平台Azure中整合ChatGPT,通过Azure OpenAI服务可以访问OpenAI开发的模型,届时微软的每个产品都将具备相同的AI能力,实现AI技术的全线赋能。
此前微软推出了由ChatGPT提供技术支持的高级Teams产品,该产品可以自动生成会议记录,推荐任务,或者创建会议模板。基于OpenAI的GPT模型,即使没有参加会议,智能回顾也能生成会议记录和要点。微软表示这项高级服务将在6月份每月收费7美元,然后在7月份增加到10美元。
4.2.2 音频生成
语音生成技术广泛应用,大厂均有布局。自动语音生成指将文本转化为语音,广泛应用于新闻阅读、有声书、通知播报、出行导航、视频配音等领域。目前,谷歌、微软、亚马逊、腾讯、阿里、百度、科大讯飞等均推出了相关平台。
科大讯飞旗下讯飞配音是以互联网为连接的专业配音服务平台,基于科大讯飞的核心智能语音技术,致力于为用户提供合成配音+真人配音服务。
4.2.3 图像生成
文本生成图像AI模型集中落地,开创图像设计新范式。文本生成图像模型可 根据简单的描述性文本生成像照片一样逼真的图像,2022年推出的Stable Diffusion、DALL-E 2、Midjourney等模型已对大众开放,在三款模型中仅 Stable Diffusion开源,已超1000万用户。
谷歌于2022年5月推出由文本生 成高清图像的模型Imagen,之后基于Imagen推出DreamBooth实现输入图 片高度还原以及个性化表达。AI创作已步入大众生活当中,并进一步赋能创 新设计和数字艺术。
4.2.4 视频生成
智能编辑为主,视频生成有待发展。AI视频编辑功能包括删除视频特定主体、自动跟踪剪辑、自动添加特定内容、视频特效生成、视频美颜,将大大降低视频编辑的专业门槛,提升视频剪辑效率,目前已广泛应用于视频创作领域。
具体应用包括剪映、百度智能创作平台、抖音、美图等。AI视频生成仍处于高速发展期,现有模型生成视频时长较短,且部分内容准确性与客观性有待提升。
目前Meta于2022年9月29日首次推出一款AI系统模型:Make-A-Video,可以仅用几行文本生成独具创意的视频,为视频创作带来新的活力。
05 ChatGPT有望开启新一轮算力储备
AI大模型训练运算量增长速度远超硬件算力提升速度。
以Transformer中的典型GPT为例,2020年发布的GPT-3训练运算量约10^8~10^9 PFLOPs,1PFLOPs=10^15FLOPs(运算次数单位),而2018年GPT-1训练运算量约10^4~10^5PFLOPs,综合来看Transformer模型训练运算量每2年提升750倍,而据摩尔定律,硬件算力提升速度为每2年2倍。
IDC预计2022-2026我国AI算力复合增速为47.5%。2022年我国服务器端智能算力为2.68*10^20FLOPS,IDC预计2026年将达12.71*10^20FLOPS,复合增速为47.5%,同时随着AI应用逐步加深,推理端算力占比将持续提升。
以GPT为代表的大模型对现有算力规模是极大挑战。结合大模型训练所需运算量增速与IDC对我国算力规模预测,我们做出下图测算,同时:
1.我国AI训练算力不会全部用于假设的5个大模型训练;
2.我国有自研基础通用大模型需求的机构或远不止5家(政府及其他企业);
3.除基础模型初始训练外,面向垂直场景的专用模型训练算力消耗亦较大;
4.大模型落地带来的推理端算力需求亦将随之快速增长。
综上,我们认为由于GPT等大模型迭代,我国AI算力超负荷或远快于下图测算结果。
对标AlphaGO,ChatGPT有望催化新一轮AI算力储备。
2016年随着AlphaGO将深度学习带到大众视野,我国迎来长达5年的AI算力储备。
我们认为,此次ChatGPT亦有望将大模型定为未来AI产业化主要路径,同时相比于迅速在新赛道建立卡位以紧握时代机遇,算力的成本/冗余/性价比或不会是科技巨头与国家的优先考虑因素,新一轮算力储备有望到来。
06 行业公司
数据标注领域的海天瑞声等;算力领域的海光信息、龙芯中科、浪潮信息、中科曙光、宝信软件、景嘉微等;算法领域的科大讯飞、云从科技、格灵深瞳、海康威视、大华股份、奥普特以及AIGC领域的万兴科技等。
海天瑞声:
国内领先的人工智能数据标注提供商,提供AI算法模型开发所需的专业数据集。业务主要涉及智能语音、计算机视觉、自然语言等场景,并积极布局自动驾驶。随着数据要素流转构建AI企业与垂直领域之间的全新产业生态,基础数据服务商将迎来飞跃式发展。
海光信息:国内高端处理器领军,成长拐点确立。
公司主要产品为面向服务器与工作站的CPU和面向AI训练、数据挖掘的DCU,早年技术来源于AMD的x86授权,但目前技术已实现自主迭代。
公司DCU系列产品以GPGPU架构为基础,兼容通用的类CUDA环境,主攻加速计算市场,每两年快速技术迭代,深算一号DCU达到国际上同类型高端产品水平。
龙芯中科:国产CPU引领者,布局工控、通用领域。
公司全面掌握 CPU指令系统、处理器 IP核、操作系统等计算机核心技术,为国家战略需求提供自主、安全、可靠的处理器,为信息产业的创新发展提供高性能、低成本的处理器和基础软硬件解决方案。
浪潮信息:国内AI服务器领头,深度受益算力基建高景气。
公司是全球领先的服务器厂商,在国内AI服务器市占率超过50%,与互联网巨头绑定深厚,有望充分受益相关巨头算力Capex投资高景气。
中科曙光:国内高性能计算领军,持股海光信息协同优势显著。
公司深耕高性能计算,受益行业信创潜在放量,自身经营质量持续提升,叠加海光信息大股东身份带来的芯片分配优势,有望充分受益算力建设高景气。
宝信软件:公司大型IDC具备充足的算力服务提供能力,可为各类人工智能生成内容公司提供算力支持服务。
2022年9月,宝之云华北基地项目开工,总投资37亿元,整体规模为2万个8KW机柜,项目定位IDC大数据产业基地,建设AI人工智能共享平台、工业互联网平台、大数据应用及智能制造研发中心,孵化一批以数字经济、AI人工智能为特色的新型企业。
景嘉微:国产GPU领军。
公司具备齐全的科研生产资质和认证,与多家科研院所和高校建立了战略合作伙伴关系。产品涵盖集成电路设计、图形图像处理、计算与存储产品、小型雷达系统、无线通信系统、电磁频谱应用系统等方向,广泛应用于有高可靠性要求的航空、航天、航海、车载等专业领域。新款JM9系列产品已能逐步满足人工智能计算需求。
科大讯飞:国内AI语音行业领军企业。
其预训练模型技术积累深厚,在教育、医疗、城市、零售、文旅、政法等领域已深度布局,在垂直领域积累了大量数据,预训练模型商业化落地空间大。
云从科技:人工智能国家队,深耕人脸识别技术。
面向智慧金融、智慧治理、 智慧出行、智慧商业、数字城市、泛AI等领域深度赋能。
格灵深瞳:国内计算机视觉算法探索者与实践者。
专注于将计算机视觉和大数据分析与应用场景深度融合,AI产品面向城市管理、智慧金融、商业零售、体育健康、轨交运维等领域。公司自主研发的人工智能产品主要包括智源智能前端产品、灵犀数据智能平台和深瞳行业应用平台。
海康威视:全球安防龙头,积极拓展人工智能与大数据技术。
公司专注于物联感知、人工智能和大数据领域的技术创新,提供软硬融合、云边融合、物信融合、数智融合的智能物联软硬件产品。
公司AI开放平台为碎片化的行业应用场景提供了一站式算法训练平台,可基于小样本数据训练高精度算法,并持续上线声音分类、文字识别、数据智能、自主学习、编排平台等功能。
大华股份:全球领先的以视频为核心的智慧物联解决方案提供商和运营服务商。
公司将人工智能作为核心战略之一,围绕感知智能、数据智能、决策智能持续做宽做深,不断提升人工智能场景化能力,加速推进人工智能规模产业化落地进程。
奥普特:国产机器视觉开拓者,打破国际品牌垄断。
公司以光源为突破口,并逐步拓展至视觉系统、工业相机、镜头、3D 激光传感器、工业读码器等领域,应用于3C 电子、新能源、半导体、汽车等领域,提升下游客户的智能制造能力,得到了苹果、华为、谷歌、OPPO、宁德时代、ATL、比亚迪、孚能等全球知名企业的认可。
2022 年上半年,公司发布了基于自研AI 和3D 算法的新一代视觉软件SciDeepVision 和SciSmart3 视觉平台,集成了预处理、定位、测量、检测、识别、3D 聚焦、自动对焦等图像处理工具。
万兴科技:国产数字创意龙头,AIGC为产品赋能。
公司于AI基础、AI分割、AI生成等领域持续研发,目前已落地虚拟人、文生图、AI智能抠像、AI智能降噪等功能,并逐步从泛娱乐、泛知识向泛营销领域等多场景渗透。公司旗下AI绘画产品万兴爱画提供随机生成与关键词创作两种创作模式,用户输入关键词,选择图片比例和艺术风格之后,即可获得由AI自动生成的绘画作品,AIGC进一步为创作赋能。