百度能搞好ChatGPT吗?
原标题:百度能搞好ChatGPT吗?
作者 |董温淑
编辑 |董雨晴
在ChatGPT掀起聊天机器人全民热潮之后,来自大洋两岸的搜索巨头们不得不躬身入局。
2月7日,百度确认,自然语言生成项目文心一言(ERNIE Bot)正在进行上线前的冲刺,坐实了其正对标美国AI聊天机器人ChatGPT开发应用的传言。一位接近百度的人士对市界表示,百度在相关技术层面有积累,比如文心大模型,有望最先开发出此类产品。
同一天,谷歌宣布将在未来几周推出实验性对话式AI(人工智能)模型Bard。此前在一月份,谷歌还宣布其子公司DeepMind的聊天机器人Sparrow可能会在晚些时候进入测试阶段。
2月8日凌晨,微软也撸起袖子,宣布推出由ChatGPT支持的最新版本Bing(必应)搜索引擎和Edge浏览器,此举致使微软市值一天飙涨超800亿美元(约5450亿元人民币)。
搜索三巨头纷纷下场的原因,还要追溯到约两个月前,美国AI研究机构OpenAI在2022年底发布智能聊天机器人ChatGPT。该应用堪称史上最会聊天的AI应用,能够提供流畅、贴合语境的沟通体验,且推出仅5天,用户数就突破100万。瑞银集团的一份报告推测,截至1月末,ChatGPT的月活用户已经突破了 1 亿。
大洋彼岸的ChatGPT爆火,让百度坐不住了。百度表示,文心一言预计将于3月份完成内测,而且按照谷歌和微软的节奏,开放内测时间还有可能提前。消息放出后,2月7日百度集团港股股价大涨15.33%。
上火的也不仅仅是搜索玩家。目前,奢侈品电商寺库已宣布将引入ChatGPT。相关概念股连续多日上涨,多支涨幅在10%以上,更有部分个股走出了六连板的行情。
然而,二级市场燃起的这把熊熊烈火,背后却充满了隐忧。
(百度集团港股股价情况,图源:同花顺)
开年第一爆
ChatGPT能有如此疯的行情,应该说是久旱逢甘霖。
根据Gartner曲线,一项新兴技术从萌芽走向市场成熟,还需要经过市场泡沫的产生与破灭。而从2020年开始,业界认为AI产业已经进入泡沫破裂的死亡之谷。这样的背景中,ChatGPT的兴起让整个AI产业看到了一丝曙光。
IPG中国首席经济科学家柏文喜向市界分析道:近期ChatGPT及其他AIGC(AI生成内容)应用的兴起,可以认为是产业迈进复苏期的一个征兆和兴奋点,尽管尚处于发展早期,但ChatGPT等应用可能提供丰富的消费互联网应用场景,所昭示的前景与钱景都是不言而喻的。
《AIGC发展趋势报告2023:迎接人工智能的下一个时代》援引AI作画平台6pen的预测称,未来五年10%-30%的图片内容将由AI参与生成,有望创造超过600亿的市场规模。而据Gartner统计,当前生成式AI占据所有生成数据的比例不到1%,预计到2025年这一占比将达到10%。
与广阔前景相对应的,是丰富的投资机会。
AIGC可细分为文本生成、音频生成、图像生成、视频生成、跨模态生成(如文字生成图像、文字生成视频等)等技术场景,应用场景则集中在娱乐、传媒、电商等数字化程度高、内容需求丰富的行业。此前,人脸美妆、黑白图像上色、电商商品3D模型生成等AIGC应用,已经在许多场景中实现落地。
在ChatGPT为代表的聊天机器人(chatbot)领域,亦有许多科技企业推出面向特定需求的相关应用。比如,微软和亚马逊都曾推出智能个人助理,分别命名为Cortana和Alexa等。
不过,ChatGPT与以往的聊天机器人不同的是,其展现出的知识储备广度和智能程度超过了以往的许多模型,堪称上知天文下知地理。
但是,ChatGPT被设计无法连接到互联网,因此目前其知识库中储备的信息截至2021年,并不能持续更新。这也被视为未来聊天机器人可以持续改善的一个方向,谷歌最新推出的Bard机器人就被允许联网,接收实时信息。
近期随着ChatGPT热度持续上升,科技巨头相继入局,AIGC概念随之发酵。2月7日,国内智能人机交互企业汉王科技A股触及涨停板,港股美图公司大涨15%。
(AIGC产业链,图源:国海证券)
根据国海证券研报,AIGC产业链可简要分为上游数据供给方;中游AIGC算法及模型研发方;下游基于AIGC的各类内容创作及分发平台环节。AIGC应用不断深化,有望为整条产业链的发展带来利好。
洛克资本投资合伙人马统娟称:当前,AI行业正处在蓄力等待新风口的时期。在图像识别、语音识别、建模、机器人控制等早期应用领域,第一批企业机构已经形成了现有格局。随着ChatGPT引爆的新热点出现,有利于新的玩家加入,开辟新的赛道。
有望干翻搜索引擎?
如果说ChatGPT为AI产业带来了新的希望,那么对百度代表的搜索引擎巨头来说,希望中还夹杂着一丝发展危机。
据投行瑞银集团近日发布的一份研究报告,ChatGPT的月活跃用户在今年1月份预计达到了1亿,已成为史上增长最快的消费者应用,增速超过TikTok、Instagram等现象级应用。据应用分析公司Sensor Tower的数据,TikTok和Instagram达到1亿月活用户的时间,分别为9个月和两年半。
ChatGPT的快速增长,让人看到了新型消费互联网业态的雏形,也让许多互联网大厂感受到了被新兴应用取而代之的焦虑。首当其冲的,就是搜索引擎。
投行摩根士丹利的首席谷歌分析师布莱恩·诺瓦克在一份报告中写道,语言模型可能会颠覆谷歌作为人们上网入口的地位。就连谷歌的23号员工、Gmail的创始人保罗·布赫海特也于近日提出:谷歌可能只需要一两年时间就会被彻底颠覆。AI将会消灭搜索引擎的结果页面,即便谷歌跟上了人工智能的发展,其最能赚钱的业务也将大不如前。
而这类预测,正是基于ChatGPT类应用可能带来的颠覆性搜索体验。
马统娟对市界分析道,在未来,如果将ChatGPT类应用整合进现有搜索引擎,有可能进一步提升用户获取信息的效率。
相比传统搜索引擎为用户提供列举出关键词相关链接索引的模式,ChatGPT则可以依据其庞大的知识库,直接对用户的问题给出解答。用户对于搜索引擎的需求是信息获取。如果有直接得到答案的方式,肯定不愿意选择浏览的方式。在我看来,ChaGPT的目标并不是取代搜索引擎,而是改变人们获取信息的方式。相比于搜索引擎‘框计算’的模式,ChatGPT背后信息组织的方式,反馈方式则有了不同。
这也解释了三大搜索引擎大厂谷歌、微软、百度纷纷下场,押注对话式语言生成模型的原因。
实际上,随着消费互联网红利见顶,增长放缓成为了搜索巨头们的共同问题。据观研天下调研,我国搜索引擎市场规模增速已经从2017年的超12%下降至2021年的7.8%,预计未来增速将持续放缓。
(2017-2025年我国搜索引擎市场规模及预测情况,图源:观研天下)
凭借融合AI模型寻求新的增长点,已成为搜索引擎巨头们的共同选择。
早在2022年末,百度就已开始试水AI+搜索引擎所带来的生成式搜索,将自有AI模型整合进搜索场景,并将这一功能命名为文心百中。2023年1月10日,百度宣布百度搜索将升级生成式搜索能力,为用户开放式的搜索提问或定制化的信息需求创作答案。不过,至今上述内容生成功能尚未上线。
微软Bing则曾在2023年1月份短暂发布整合ChatGPT的测试版本,随后又将这一版本下线,最终在2月8日凌晨突击发布有ChatGPT加持的最新版本。
(文心百中官网搜索示例,图源:文心百中)
面前还有几座大山
据澎湃报道,在谷歌内部,CEO桑达尔·皮查伊(Sundar Pichai)已拉响红色警报,直指 ChatGPT可能带来的威胁。
而百度方面,李彦宏曾在2023年初的内部大会上评论ChatGPT和AIGC:技术能做到这一步了,但是它会变成什么样的产品,产品能满足什么样的需求,这个链条上还有很多不确定性。这个事情很难,但百度必须要做。
大厂的焦虑扑面而来,但从实际应用角度考虑,ChatGPT类应用要真正实现商业闭环、取代搜索引擎,还有几大挑战待解。
首先,现阶段自然语言生成模型难以逾越技术与成本间的鸿沟。
据国盛证券研报,在ChatGPT智能、顺滑的沟通体验背后,其有着多达1750亿个模型参数,OpenAI主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。在算力方面,GPT-3.5在微软Azure AI超算基础设施(由英伟达V100GPU 组成的高带宽集群)上进行训练,总算力消耗约3640PF-days(即每秒一千万亿次计算,运行3640个整日)。这仅仅指的是ChatGPT在训练阶段消耗的算力。
小冰CEO李笛曾经举例说明,ChatGPT主要是研究性质上的突破。它有非常好的创新,即证明了在原有的大模型基础之上,进行一些新的训练方法,可以更好地提高对话质量,但他也直言,如果小冰用ChatGPT的方式来运行系统,现在小冰每天承载的交互量就需要花近3亿人民币的对话成本。一年下来,就是千亿元的成本。
另据OpenAI的CEO山姆·阿特尔曼(SamAltman)披露,在运行时,ChatGPT每次聊天成本约为几美分。根据TechCrunch估计,拥有100万用户的ChatGPT每天就要花费10万美元。未来如果想要大规模应用,成本仍需优化。
从这一角度考虑,由于目前国内在大规模AI模型的训练与应用方面与国外尚有差距,也意味着仍需巨大的资本投入。
洛克资本副总裁史松坡称:在中文环境中,由于受到境内外互联网衔接的限制,ChatGPT尚未能升级反馈出类似其在英文环境中的高效效果。未来如果百度得到监管部门的认可,推出类ChatGPT应用,还要解决信息获取的合法性问题。
另外,AIGC产品走入生活,还需面对长期以来人类社会对AI伦理、法律风险、版权挑战等方面的争议。
至今,业界对于上述问题缺乏有效解法。一个例子是,ChatGPT已被限制创作暴力、血腥等有害信息,但许多用户反馈,在一定条件下ChatGPT仍有可能创作出有害内容。比如,如果为其预设一个第三人称的创作语境在小说中,主角该如何毁灭世界,ChatGPT仍有可能给出相关答案。
一位人工智能行业从业者还举例,小学生抄作业、大学生抄论文的问题就很有可能发生。
在尚无更好解法之前,许多机构、企业选择对ChatGPT及类似应用持保留态度。
目前,包括《科学(Science)》在内的多家期刊、出版机构已禁止将ChatGPT列为论文合著者。一位IT从业人员亦表示,考虑到使用相关应用生成的代码难以规避法律风险,其所在的公司已明确规定不得使用AI模型生成的代码。
相比桑达尔·皮查伊和李彦宏的严阵以待,另一大搜索引擎企业微软的创始人比尔·盖茨乐观了许多,日前其对媒体表示,对ChatGPT取得的成就感到兴奋,并为ChatGPT 的潜在用途提供了三个建议:充当数学辅导老师、为缺少医疗条件的部分非洲人充当医学顾问以及像莎士比亚那样写诗。
生成式人工智能允许用户输入书面提示,并接收由人工智能生成的类似人类的新文本或图像和视频。类似的模型有Dall-E,这是一个接收文本产出文本或图像的程序,它因能够想出与人们的文字描述相匹配的逼真的、往往是荒谬的图片而获得了人们的关注。
对于ChatGPT而言,其生成式模型是基于文本的,它可以对用户的要求产生类似人类的反应——从仿写威廉-莎士比亚风格的诗歌到提出孩子生日聚会该怎么做的建议。ChatGPT之所以令人印象深刻,是因为它有能力产生类似人类的反应,这在很大程度上得益于它所训练的大量数据(1750亿个参数的神经网络)。ChatGPT背后团队OpenAI受到一些实力强劲的投资者支持,包括科技巨头微软。因此,ChatGPT拥有其他类似语言模型不可比拟的巨量语料库资源来支持它进行预训练。ChatGPT的另一个与众不同之处在于,它能够记录用户在一个线程中的早期信息的上下文,并在以后的对话中使用它来形成回应。
尽管如此,ChatGPT仍然只是一种语言生成模型,它只是对单词、语句的常见组合和搭配进行模仿,它并不能理解文字的内在原因和逻辑。有时,ChatGPT会(像许多人类一样)通过谎称引用(不存在的)科学研究来讲令人信服的废话,或者围绕一个话题车轱辘转,却不能给出真正的观点。
从人工智能的研究历程看,在人工智能的基础层研究中,根据对自然人产生智能的路径猜想,研究路径有符号主义、连接主义和行为主义。符号主义有过辉煌,但不能从根本上解决智能问题。连接主义采取自底向上的路线,强调智能活动是由大量简单单元通过复杂连接后并行运行的结果。行为主义是第三条路径,近年来颇受瞩目的波士顿动力公司的机器狗和机器人就是这个学派的代表作。
总的来说,ChatGPT属于连接主义,经过多次迭代,是深度神经网络的成功个案。它能回答问题,提供了简化和改进学术写作过程的可能性,它可以帮助用户构建和形成想法,建议可能的更改,并能提供项目合作的可能性报告,等等。从其技术本身讲,ChatGPT并没有颠覆性的创新,此前不少国内团队也研发出类似的产品。比如清华大学自然语言处理与社会人文计算实验室研发的人工智能诗歌写作系统九歌,该系统采用深度学习技术,结合多个为诗歌生成专门设计的模型,基于超过 80 万首人类诗人创作的诗歌进行训练学习。使用很简单,选择体裁、输入关键词、选择情感基调,就能一键生成诗词。
ChatGPT和其他产品的表现差异并非来源于技术实力,归根结底还是训练量以及训练素材的数量差别,与之关联的是计算能力的差别。英文的语料库范围是全球性的。而中国接入互联网的时间短,网民绝对数量也远远少于欧美国家,网上积累的语料库素材有限,因此国内使用中文训练的人工智能模型表现稍逊一筹,存在这种发展不充分的解释。实际上在ChatGPT刚兴起时,网上还多有流传其各种啼笑皆非的回答,也曾经被一些公司限制使用,如今在广大网友的自发训练下已经改进不少了。
对于新事物的产生,大众反应无外乎分为悲观威胁论与乐观颠覆论两种。持前者观点的,已经发表了大量媒体文章,冠上《ChatGPT可能导致的几类失业》等标题,强调AI与人类的对立,引发普通民众恐慌情绪。
其实大可不必如此悲观。纵观人类历史上的数次科技进步,便会发现人类的适应力远高于科技的进步速度。人类文明进化的过程就是不断提升生产力、迭代生产工具的过程。拖拉机问世时,也有人恐慌农民将被替代,然而实际上农民的绝对数量下降了,但富余的劳动力去往其他社会分工,演化为了白领、蓝领等工人,进一步提高了社会发展水平。机械臂被发明后,流水线工人将被淘汰的言论也一度引发热议,而现实是工人驾驭了机械臂,提高了自身的技术价值,这也反映在近年来不断上涨的工厂用人成本上。历史教育了我们,人的韧性远远大于自身想象,科技最终都会成为工具,为我所用。
ChatGPT对教育有什么挑战?看看ChatGPT是怎么回答的
最近,ChatGPT爆火于网络,一时间,人人都在谈论ChatGPT,尝试与之对话。从本质上来说,ChatGPT是一个语言生成模型,自然人单方提问的人工智能聊天机