解读:什么是AI大模型?国内“百模大战”正式开打!
AI大模型是什么?
AI大模型是人工智能预训练大模型的简称,包含了预训练和大模型两层含义,二者结合产生了一种新的人工智能模式,即模型在大规模数据集上完成了预训练后无需微调,或仅需要少量数据的微调,就能直接支撑各类应用。例如浪潮信息于去年9月推出的2457亿参数的大模型源 1.0,一个模型就能提供聊天、对话、知识问答、写作等各类应用。
从应用角度指出,大模型与训练数据、预训练等构成了AI的基础架构,这种基础架构即浪潮信息提出的算法基础设施,在此基础上,可以支持算法更高效地融入当前企业各类业务所使用的工具软件,形成算法应用价值的商业变现。
大模型进入博弈期
GPT-4的发布在各个领域引起了巨大的轰动,因为它在人工智能技术中达到了一个新的高度。在某些领域,GPT-4已经显露出了其绝对优势,或者说AI霸权。这里说的霸权不是政治学里面的操纵或控制其他国家的地位,类似于之前为人所知的量子霸权的说法,即在某一领域产生原有工具远不能及的技术优势。
GPT-4以及众多生成式人工智能的背后,是人工智能大模型的训练结果。随着如ChatGPT和文心一言逐渐进入应用和商业层面,背后的各个大模型也进入关键博弈期。中国能否在未来数年内推出自己的大模型成为关键。
市场争夺战一触即发
大模型竞争同时也是一场市场争夺战。先占领市场、研发排他性强独占性强的优势产品,既是大厂企业的竞争策略,也是优势厂家的竞争结果。目前,谷歌推出类似ChatGPT的大模型Bard之后,谷歌与微软的竞争再起:微软正聚焦在B端(如办公软件、云计算和人工智能相关产品)以及游戏等相关领域,而谷歌则在C端市场、互联网领域推出更多定制化产品。而不管是B端还是C端,对这些优势产品必然有依赖性,这样的依赖性也将是这些产品继续在所处赛道扩大优势的重要方式。
对于那些获得大模型先手优势的企业来说,在这轮竞争中更容易积累数据雪球、建立数据壁垒。在自然语言处理领域,数据是训练大型语言模型的基础,因此拥有高质量的数据集是非常重要的。
此外,拥有市场和壁垒的企业将进一步对国际标准制定发起进攻。人工智能大模型的国际标准领域,包括模型的设计和开发标准、模型的应用和部署标准、模型的数据隐私和安全标准、模型的伦理和社会责任标准、模型的性能和效果评价标准等等。在某一市场和领域,通过制定国际标准,企业可以获得更广泛的认可和市场份额。特别是对一些排他性的技术、软件和产品,一旦国际标准被确定下来,制定标准者将能够决定市场走向。
中国AI大模型竞速
ChatGPT引发的大模型热潮依然汹涌。从上周末开始,各大企业AI大模型落地的消息接踵而至。4月7日,阿里云自研大模型通义千问开始邀请用户测试。4月8日,京东集团副总裁何晓冬称将在今年发布新一代大模型ChatJD,同日,华为云介绍了盘古大模型的进展和应用。4月9日,基于360GPT大模型开发的人工智能产品矩阵360智脑率先落地搜索场景。更多的AI大模型正在飞奔而来的路上。腾讯、字节跳动、同花顺等企业的AI大模型产品近日将会陆续亮相。
还有越来越多的上市公司披露了大模型领域的最新进展。4月10日,昆仑万维、商汤科技均公布了自家的大模型产品。
与OpenAI为ChatGPT引入插件,创造AI逻辑下的生态系统相似,4月11日,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇表示,阿里巴巴所有产品未来将接入通义千问大模型,并进行全面改造。张勇认为,面向AI时代,所有产品都值得用大模型重新升级。
可以预计,在中国规模庞大的互联网用户的支撑下,国内企业在算法和算力上有望不断实现突破并取得领先。从算力到应用,已经按下了AI大模型发展的加速键。
解读大模型之战
大模型的竞争很可能像九十年代PC操作系统的竞争一样,具有垄断性的倾向和趋势,其本质还是在于大模型和操作系统一样,都是一个技术新时代的基础设施。如同需要搭乘操作系统的软件一样,所有的人工智能产品,尤其是生成式人工智能,乃至未来可能的通用型人工智能,都需要依靠背后的人工智能大模型才能完成训练、输出等一系列动作。
而这样的大模型,与操作系统一样具有垄断性的特点。一方面,不管是大模型还是操作系统,它们的竞争都是不同生态之间的竞争。操作系统的成功与否,关键在于生态系统,需要能够搭建起完整的软件开发者、芯片企业、终端企业、运营商等产业链上的各个主体。大模型也是同样的道理,一个优秀的大模型也将会建立起一套排他性强、独占性强的生态系统。
另一方面,一旦某一个大模型或操作系统占领了市场,它将获得相对于其他后来者无可比拟的优势。这既是由于人们对于生态系统产生路径依赖,也是源于大模型的数据特点,优秀的大模型将能吸引到更多数据,滚起数据雪球。而这样的大模型,也将成为人们唯一选择和依赖的大模型,最终形成对于大模型的依赖,后来者很难再通过同样的路径对其进行赶超。
把握关键期,决胜大模型
与操作系统之争失算一样,如果中国在大模型领域失利,好的话像苹果一样落后十年,逮到一次机会再卷土重来;不好的话可能就会像操作系统领域的中国一样,完全没有自主研发系统,直到下次变革机会。而一旦人工智能大模型领域由其他国家主宰,或者是缺少自主研发的产品,可能会引发更为严重的问题,面临在关键领域被卡脖子的风险。
目前国产大模型与美国的国际顶尖大模型相比仍然有一定的差距,涵盖数据训练、算法等方面。但恰恰是落后的时候,要直面差距、接受批评、迎头赶上。自2020年起,中国的大模型数量骤增,仅2020年到2021年,中国大模型数量就从2个增至21个,和美国量级同等,大幅领先于其他国家。未来,不管是政府还是资本方面,都应给予大模型研发相关的企业和机构更多的支持和宽容,共同推进中国人工智能大模型的发展。
中国应从国家战略科技力量的整体高度出发,组成优势互补的产业协同组合。发挥科研机构在关键核心技术上的研究优势,同时发挥大型科技企业在产品化、工程化、场景化、商业化和数据化方面的优势,成为大模型技术攻关和应用的龙头。以大型科技企业+重点科研机构为龙头,通过开源、合作、众包和生态的创新模式,引导高校、科研机构和创新型企业形成多个技术路线的创新生态群。
2023年无疑是生成式人工智能的关键一年,就在这个4月,一场大模型风暴已经来临:4月8-9日,华为盘古大模型发布会;4月10日,商汤大模型发布会;4月11日,阿里大模型发布会;4月14日,同花顺AI产品发布会;4月18日,阿里行业类模型发布会。人工智能大模型正在不断升级迭代,推出包括交通、能源、金融、医疗等一系列应用大模型,实现与产业的深度融合。一方面进一步利用数据这个生产要素,提升我国企业数字化和智能化转型的比例,推动产业数字化进程;另一方面,也将为行业产业降本增效,创造出新需求、新商业模式和新的经济增长点。
GBAA,面对变化,为你赋能,纵使变化永恒,你有粤湾商盟,欢迎关注公众号。
【精彩回顾】
外资银行开户注意事项(Notes for opening a bank account of WFOE)
*本文来自粤湾商盟,未经授权不得转载。如有侵权请及时联系,我们会根据著作权人要求处理相关内容。