中国企业蜂拥ChatGPT,谁是第一个实现产品化落地玩家
最近关于ChatGPT的讨论越来越热,甚至有人认为ChatGPT的出现不亚于互联网的发明。
在国外,微软宣布将ChatGPT与搜索引擎Bing整合,谷歌宣布推出Bard应对挑战。中国企业也不甘落后,纷纷宣布推出ChatGPT的时间表。这其中就有搜索引擎企业百度和三六零、电商企业阿里巴巴,以及人工智能企业科大讯飞等。
百度宣布三月份推出类ChatGPT产品,三六零和阿里巴巴并未公布时间表。而科大讯飞则宣布5月6日在学习机产品上率先落地ChatGPT,这是唯一给出确切上市时间,并率先实现商业化的中国企业。
得益于ChatGPT概念的火爆,科大讯飞股价连续大涨超过40%。在许多分析师以及同行的采访中,科大讯飞也被认为是最有机会落地ChatGPT的企业。那么,科大讯飞到底凭什么?
在回答这一问题之前,我们先了解下打造ChatGPT的三要素:算法、算力和数据。如果用一辆汽车来比喻,算法就是汽车的发动机核心技术,是软件;算力是发动机硬件,它们共同决定了发动机的优劣,而数据则是燃料。
首先,科大讯飞的算法实力如何?
公开资料显示,预训练模型范式逐步开始在自然语言处理领域应用起步于2018年。当时OPen AI公司的GPT1模型发布,然后向全世界开源。也正是从那一年开始,包括谷歌、微软、OpenAI、科大讯飞、智源、鹏城等单位陆续推出预训练模型。
此后,OPenAI推出GPT2.0,直到2020年推出了GPT3.0,不再向外界开源。而这期间,科大讯飞承接了认知智能领域首个国家重点实验室,面向认知智能领域陆续开源了6大类、超过40个通用领域的系列中文预训练语言模型,开源3年模型库月均调用量超1000万,成为业界最广泛流行的中文预训练模型之一,在Github平台的中文预训练模型的星标数达13346位列第一。
在2023年年会上,科大讯飞创始人刘庆峰展示了讯飞在认知智能领域的成绩单:2022年7月OpenBookQA夺冠,让科学知识推理超过人类水平,10月夺得知识推理阅读理解任务QASC榜首,12月再夺逻辑推理机器阅读理解挑战赛冠军。
这证明科大讯飞在认知智能算法研究上与Open AI、微软、谷歌等全球知名科技公司同步,同时也取得了中文领域最好成绩。
科大讯飞在预训练模型上的先发优势也得到了同行的肯定。2月8日,三六零公司董秘在接受采访时表达了对科大讯飞的尊重,他说:科大讯飞人家从很早开始就做AI训练模型,他做的很专业。
而且他还表示,预训练大模型不是一蹴而就的事情,不是说拿开源的GPT2.0抄一抄,就能获得算法。想要吃透它,哪怕它是开源软件,吃透它可能都需要一年多的时间。
其次,科大讯飞的算力如何?
有了优秀的算法,就如同汽车配上了先进的发动机技术,是软实力的体现。而算力水平决定了硬件实力。根据Open AI于2018年的统计,自2012年以来,AI训练任务所运用的算力每3.43个月就会翻倍,算力需求每年长10倍,而近几年,随着百亿参数起步的AI大模型的流行,AI应用对算力需求又迈上了一个新台阶。
目前,OPen AI背靠微软这棵大树,拥有强大的算力支持。科大讯飞的算力如何呢?
2022年12月22日,科大讯飞在接受《红周刊》采访时曾对外表示,在算力平台方面,讯飞于2009年开始算力基础设施建设,目前已建成4城7中心深度学习计算平台,讯飞的算力不仅完全满足AI算法模型训练,及面向开放平台数百万开发者和其他行业伙伴提供相关AI服务的需求。同时,讯飞坚持深度学习框架和平台的自主研发,构建了专业的深度学习技术研发团队并积累了大量研发经验,具备框架、算法的研发能力,并基于此持续在深度学习算法上取得丰硕创新成果,且框架和平台对于国产GPU和硬件的支持处于业界领先水平。
特别是在当前的恶劣国际环境下,科大讯飞已经在算力布局上做到了自主可控,实现了国产替代。据官方数据,目前讯飞研发训练服务器已经开始进入国产化, 切换之后效率有的是原来平台的 70-80%,有的效率是超原来平台100+%。另外在算法上,也启动了推理服务器的国产替代;像部分产品,学习机芯片已经全部切换成国产自主。
而在三六零董秘的专访中,他也表示:科大讯飞一直在做专业的AI训练,所需要的算力,我觉得还是绰绰有余的。
与预训练模型一样,算力也并非一日之功。作为一家专业人工智能公司,十余年来随着自身训练需求和客服服务需求的高速增长,其算力的增长是同步的。这也为科大讯飞建立了深厚的竞争壁垒和先发优势。
再次,科大讯飞的数据积累如何?
Open AI在GPT3.0算法发布之前一直是开源的,产品也一直是免费的。这是为了获取海量的用户交流数据。数据,是发动机的燃料。通过海量的数据投喂,不断人工修正和标记数据结果,让ChatGPT变得更加聪明。
在国内,搜索引擎、社交平台都拥有海量的大数据,这为它们的AI训练提供了养料。科大讯飞在通用数据量上无法与它们相比,但是在专用数据上则具有绝对领先优势。
据科大讯飞官方透露,在数据支撑方面,讯飞充分发挥数据和技术紧密耦合优势,在数据建设方案设计、人机协同数据高效标注和质检、数据标注团队拓展等方面具有深厚积累,并构建了可支持单机、局域网、互联网等不同模式的人机协同数据标注平台,满足不同类型数据标注的需要。
而且,科大讯飞在教育、医疗、办公市场拥有绝对领先的市场份额,这都为科大讯飞积累了海量的专业数据。比如,目前科大讯飞智慧教育产品已在全国32个省级行政单位50000多所学校中应用,服务超1.3亿师生;在AI学习机市场,去年营收增长53%,一直是份额最高的学习机产品;智医助理产品覆盖了全国380个区县,5.3亿次AI辅助诊疗。
很多用户在使用ChatGPT时发现,它也会出错。而且美国禁止ChatGPT在校园里被使用,也考虑到其在给出知识问答时的准确性。在教育、医疗这些专业领域,AI更不能给出错误答案,而这正是科大讯飞在专业数据领域的优势。
对此,三六零董秘也表示,科大讯飞在医疗、教育领域有很好的市场地位,有强大的算法和海量数据,比如,有专业教育领域数据支撑它做专业教育AI产品,有医疗有大量的处方单和病例来支撑他做专业的医疗AI。
他还认为,从专用AI向通用AI的跨越可能只是一层窗户纸,是完全可行的。
正是得益于在专业数据、算法领域的先发优势、技术积累和数据积累,科大讯飞才能够在行业里首个落地ChatGPT到讯飞学习机,这应该也是中国首个实现ChatGPT商业化的产品。
商业化是不得不考虑的选项。目前,OPenAI的ChatGPT在做付费问答,而这种商业模式仍然比较单一,很难填补ChatGPT在算力上的消耗。所以,ChatGPT除了收费使用外,还对外开放接口,通过付费调用的方式获得营收,同时也提高数据训练量,让产品变得更聪明。
笔者认为,当前国内许多企业都在计划推出类ChatGPT产品,除了技术创新之外,如何找到优秀的商业模式,做到投入产出平衡也至关重要。
综上所述,在中国,科大讯飞成为首个落地ChatGPT产品的人工智能企业,得益于其在认知智能上的先发优势,拥有中文领域领先的算法,强大的算力,以及在教育、医疗、办公等领域专业的数据积累。
同时,在2023年年会上,刘庆峰还表示,未来5年,讯飞将实现500亿根据地业务营收、200亿毛利,这也将为讯飞继续提升ChatGPT技术提供强有力的物质保障。
其他精彩文章:谷歌类ChatGPT产品犯错,市值一夜蒸发7000千亿,百度瑟瑟发抖
磐石之心,《解密小米》《互联网黑洞 跨越边界的中国式企业扩张》作者,评论人。
在阿里云注册的域名如何在网站备案?仍旧是在阿里云提供网站备案服务吗?在阿里云注册域名不一定要在阿里云网站备案,下面做详细解释。在阿里云注册的域名如何在网站备案?网站备案流程