美亚柏科人工智能科学家赵建强:ChatGPT是AI生成领域的里程碑,与行业应用结合将产生深远影响
每经记者 赵李南 每经编辑 董兴生
近期,ChatGPT概念席卷A股,截至2月10日,概念股中已有股票斩获7连板。
ChatGPT一经问世,便成为舆论焦点,如今亦化身资本宠儿。但关于ChatGPT本身仍然存在不少疑问,这究竟是一个怎样的技术?在AI发展的历史长河中,ChatGPT的诞生,究竟算一个怎样的事件?
近日,《每日经济新闻》记者专访了美亚柏科(SZ300188,股价15.21元,市值130.73亿元)人工智能科学家、AI研发中心总经理赵建强博士。赵建强毕业于西安交通大学计算机科学与技术专业,获得博士学位。多年来,赵建强及其研发团队在美亚柏科从事人工智能相关研究。
赵建强表示,2022年被业内称为AI生成的元年,ChatGPT是一个里程碑式的产品。同时,ChatGPT背后所依托的超大规模语言模型技术也将在各行各业产生深远影响。
除了OpenAI的GPT预训练模型,实际上,谷歌、微软、Meta、百度也有推出类似的模型,但他们暂时没有把这些功能开放成一个聊天机器人。赵建强告诉记者。
是AI文本生成领域的里程碑
在文本理解和智能问答技术方面,ChatGPT是一个里程碑式的产品。赵建强说。
记者注意到,ChatGPT之所以能够火爆出圈,重要原因是其交流的流畅度和知识的丰富程度比之前的类似产品有很大提高。
在业界,我们把2022年称为AI生成的元年,不仅是ChatGPT,实际上OpenAI还开放了图像生成的一些模型(DALL•E 2),只是没有像ChatGPT这么热。ChatGPT在AI生成内容方面或者AI创作方面是一个里程碑的节点,是比较有影响力的一个阶段性成果。赵建强认为。
他介绍,ChatGPT的相关技术模型此前早已有之。OpenAI之前就发布了ChatGPT的大语言模型。ChatGPT实际上是基于GPT-3.5这个版本的超大规模自然语言预训练模型,之前已经发布过GPT1.0、2.0和3.0版本,现在用的是GPT-3.5的版本。ChatGPT基于GPT模型,利用人类反馈强化学习训练的方式,学习人类提问机器答、机器提问人类答等模式,不断训练迭代,以实现智能对话聊天功能。
赵建强向记者解释:ChatGPT交流得非常顺畅,基本上聊到的内容都能回答,这主要得益于其具有的超大规模自然语言预训练模型GPT3.5,模型在训练时使用了海量人类在互联网上所编辑生成的多种类文本数据集。OpenAI的官方介绍显示,GPT训练使用了超万亿级单词量的数据。此外,模型的参数规模也非常大,3.5版本的参数规模就达到了1750亿。目前来看,可能只有一些AI超级巨头才具备这样的数据量和计算能力。
赵建强认为,由于具备了生成能力,ChatGPT将会对很多行业产生影响。
以前我们理解的AI更多处在计算智能和感知智能阶段,比如图像识别、人脸识别、文本观点分析等。现在AI已经具备认知智能的能力,可以根据命令需求,创作生成各类文稿、文案,也可以通过文本场景描述生成图像和视频。所以说以后AI在内容生成创作、文本生成文本、文本生成图像、文本生成视频等方面,都具有广阔的应用前景。ChatGPT解锁了多样化的文本内容生成能力,带来AI创造世界更丰富的想象空间,将会应用于文本理解、文本创作、文案撰写、知识推理、翻译、智能客服、文本生成图像,代码理解、审查和生成等多个方向,具体跟一些行业应用结合起来,将会产生比较大的行业影响。赵建强表示。
利用大语言模型反诈骗
此前,美亚柏科在投资者互动平台上表示:公司从2020年开始关注这类AI技术滥用与犯罪的行为,研究对深度合成内容的检测识别和鉴定相关技术,研发了针对视频图像伪造生成检测鉴定的产品,积极参与人工智能合成和生成技术合规应用的行业标准的制定,协助执法部门维护网络空间安全,规范人工智能技术的良性发展。
赵建强所在的部门一直在从事AI方面的研究。以ChatGPT为代表的超大规模语言预训练模型技术出现之后,大大推动了AI业务,特别是AI生成内容类业务落地的进程。
美亚柏科的主要业务领域包括电子数据取证、大数据智能化、网络空间安全、智慧城市等。
我们的做法也类似,我们采用‘超大规模预训练模型+下游任务迁移’的技术思路,利用超大规模的语言预训练模型,再结合具体的项目和数据,训练形成具有行业特色的应用模型。实际上,美亚柏科在自然语言处理、OCR、计算机视觉以及人工智能安全这些领域已经开展了多年的业务实践,基于在电子数据取证和执法部门大数据智能化领域多年的深耕和知识经验的积累,对行业客户数据特点和业务需求的深刻理解,提出了文本智能分析理解、不良多媒体文件分析、反诈骗信息鉴别、多模态信息检索等多个独有的核心算法模型,并已经在打击犯罪、社会治理、智慧城市建设等方面发挥了实战价值。赵建强称。
比如在反诈骗领域,大语言模型的识别效果要远超此前的识别模型。赵建强提到:比如之前面对小模型或者小数据量的情况下,在文本的理解和识别上所实现的效果不是很理想,超大规模语言预训练模型技术将有效推动这类业务落地。
通过利用已有的大规模语言预训练模型,结合诈骗场景下的语言特点,我们就可以去学习训练相关的识别模型。诈骗通常是通过文本聊天交流,具有一定的语言特征,也就是诈骗话术,在理解这些话术之后,再去检测识别。赵建强说。
赵建强继续解释:比如有些受害人会被拉到一些所谓的理财群里,诈骗人员以推销交流虚假理财投资产品的名义诱导受害人。我们就可以通过训练针对投资理财类聊天文本识别模型去鉴别,如果出现类似内容就可以检测出来。还有一类就是识别发现各种诈骗网站,通过对诈骗网站网址、页面文本内容、图像内容等的特征学习,训练形成针对不同类别诈骗网站识别的模型,提升海量网站数据中打击诈骗网站的能力。目前,我们已经把这些技术和能力应用到了反诈预警当中。
此外,有不少投资者也在投资者互动平台上问及美亚柏科的相关业务。美亚柏科回复称:公司将ChatGPT的相关技术融合应用到产品售后支持部门,基于取证产品知识库,研发智能客服机器人系统,提升服务水平。公司将在国家相关法律法规许可的框架下持续关注、研究、利用ChatGPT等新技术,并与公司大数据智能化、电子数据取证等业务融合,积极参与相关行业标准制定,并适时布局新业务。