逐鹿ChatGPT看到钉子才想起找锤子
来源:北京商报
AI领域永远不缺惊喜,本以为计算机视觉让人审美疲劳,AIGC唤出产业又一轮热潮;本以为Siri、小爱、小度不过如此,ChatGPT引爆了全球视野。上一次如此耀眼的AI明星还是2016年暴走围棋圈的AlphaGo,但那条狗离普通人有点远,像个人的ChatGPT让亿万用户触手可及。
重要的是,ChatGPT很快,微软一马当先,谷歌紧随其后,百度一个月后见……似乎验证了那句话:AI竞争基本处在同一个起跑线。
恐怕现实还是有点残酷,不然谷歌不至于演示首秀就栽了跟头,市值一夜蒸发千亿美元。
AI是未来世界的科技底座,本身则是科技演进史的少年初长成。它的萌芽到壮大,及至结出AlphaGo和ChatGPT的小有成果,不只是全球程序员工程师的努力,也承载全球投资者和消费者的审视——认知水平纵有不同,但作为互联网原住民,有着大致相同的期待。
因此,AI从科学到技术再到产品的转化链条,前所未有的急迫,给不了3C数码或者互联网少则三十年多则四五十年的转化期。放到产业竞争中,数码产品或互联网产品惯用的很多策略不再适用。
其中,最明显又最意外的征象就是,互联网大平台不再赢者通吃,需要重新思考拿着锤子找钉子还是瞄准钉子找锤子,这是一个博弈困局。
ChatGPT斜刺里杀出,至少证明了谷歌的局促不安:AlphaGo的历史光环,没能避免这次的慌慌张张。
大趋势大平台大资金+相通的AI开源框架,让大公司一度相信,AI落地就是拿着锤子找钉子或者拿着锤子看谁都像钉子,即便小企业不乏灵光乍现,大企业也能快速截杀。
这一招曾在全球范围的消费互联网市场无往不利,门户、搜索、社交、电商、视频……平台收割概莫如此。
即便在AI早期,拿着锤子找钉子也是常态,AlphaGo惊艳但并不太让对手紧张:你搞围棋AI,我就搞象棋AI,甚至大型网络游戏AI。在商业场景明细的自动驾驶、计算机视觉、智能音箱等市场亦是如此,大厂的规模优势持续形成碾压。
但ChatGPT显得不一样,并无浓厚的商业初衷,极其简陋的产品形态,就圈了亿万用户,到目前也就是个测试性质的工程模型。
不准确且略显圆滑,不工业但确有人味,ChatGPT拿捏了最初心的AI诉求,就砸下了最犀利的一枚钉子。
大厂猛地惊醒,原来聊天机器人可以这样玩,原来钉子要砸在这个位置,再回过头捡锤子时才发现可能并不顺手。
问题大吗?追得上就不大,追不上就大。尴尬在于,ChatGPT之锤的材质并不稀奇。就背后技术而言,无论是大规模语言模型LLM,还是带人类反馈的增强学习RLHF,都在大厂的技术仓库里。
只不过,算法优化、模型训练、人工反馈、工程迭代……围绕让机器聊天更有人味这件小事,大厂不做或者做得不持久,而ChatGPT做了并坚持下来,最后成功的就不是最早拿起锤子的那个了。
北京商报评论员 张绪旺
责任编辑:李桐
-
上一篇
近日,由人工智能实验室OpenAI发布的对话式大型语言模型ChatGPT在各大中外媒体平台掀起了一阵狂潮。短短4天时间,其用户量到达百万级,注册用户之多导致服务器一度爆满。继 AI 绘画之后,由OpenAI 上线的 ChatGPT 成了新的流量收割机,也引发了网友的一系列花式整活。ChatGPT的功能是如此强大,以致连马斯克都认为我们离强大到危险的 AI 不远了。
ChatGPT究竟是什么?
ChatGPT是由美国开放人工智能研究中心(OpenAI)发布的一个聊天机器人程序,其实早在去年11月30日就已经发布了,有一项调查显示,截至2023年1月,美国约有89%的大学生在用ChatGPT完成作业。
本质上来说,ChatGPT是一个由技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。
那么,为什么ChatGPT能引起如此大的市场反应呢?
之所以能让马斯克发出强大到危险的AI的感叹,是因为ChatGPT作为一个人工智能模型,真的在产出类似人类的常识、认知、需求和价值。比如,根据很多用户的反馈,你可以提问ChatGPT对很多社会问题的看法,而其可以从广大群众的角度,通过客观理论的推理来进行解释,从而提供具有社会价值的答案。
而从技术角度来说,它是因为引入了新的算法技术RLHF,即基于人类反馈的强化学习。可以说,ChatGPT的火爆是技术工程和服务产品的胜利。过去我们更为常用的是LLM,也就是大型语言模型,但是它的建模过程中并没有显式的引入人的偏好和主观意见,因而就缺少了人们从ChatGPT上面可以找到的人的味道,而RLHF的本质逻辑就是用生成文本的人工反馈作为性能衡量的标准,或者说是用这种反馈来优化模型,也就是说,直接使用强化学习的方式来直接优化带有人类反馈的语言模型。
正是这种快速反馈,让用户有了对ChatGPT拟人化的可能,一系列类似人的语言反馈行为再叠加轻松便捷的聊天场景,人们由原本对人工智能技术的准确性、即时性、客观性的苛刻要求,已经逐步转变为人性化、趣味化、互动化的反馈需求,甚至ChatGPT有一些不太恰当的回复也会成为人与其聊天中的乐趣所在,换个说法,ChatGPT可以提供人们在聊天中所需要的情绪价值,而不仅仅是信息反馈。
更低的门槛让人工智能向通用技术转变
ChatGPT所提供的新的聊天模式,让AI技术的门槛变低了,这种变低有两个层面的含义。
一个层面是AI技术进入人们现实生活的门槛变低了。ChatGPT通过一个更为随意和通俗的聊天场景直接和用户建立了联系,并且其多元化的功能可以通过一个统一的聊天接口对接不同的用户,这就让用户层面的通用化变为了可能。
另一个层面是AI本身语料获取的门槛变低了。通过这种更为随意化的聊天场景,用户在多轮聊天过程中就会不断的提供对于ChatGPT反馈结果的进一步人工反馈,从而提供更多的语料帮助模型的进一步强化。
而门槛变低的结果,就是人工智能技术成功出圈,开始可以独立的引领一个AI为核心的大型商业化结构的形成,也就是AIGC,AIGC即AI Generated Content,是指利用人工智能技术来生成内容。在内容为王的当代互联网时代,人工智能技术生成内容自带的客观性、即时性、准确性和话题性都将成为其商用吸引力的重要来源。笔者认为从短期而言,可以大规模商用的领域,包括但不限于归纳性和整理性的文字类工作,规范性的代码类工作,图像生成和智能客服等工作。
人力资源和数据获取,是大规模商用的局限性所在
ChatGPT并没有从本质上改变AI的产品结构,其同样也是由模型和训练数据两部分来构成。模型就是类似神经网络模型,只是这一次的transformer模型有了更强的并行化操作能力和扩展性,同时匹配更大规模的数据集,就可以不断地训练出更强大的模型。
而ChatGPT未来发展可能的局限性也正是由这两方面而生。其一是模型。ChatGPT模型的背后对于标注员的工作量和综合素质要求很高,加入人工反馈的模型强化是其具有人味的关键,而这也将成为其不断扩大的局限所在。
其二就是数据和算力。由于ChatGPT的技术路线与其他AI甚至和人脑都不太一样,所以其仍然会受到算力资源和算法的限制,其也无法更加深入地具备真正意义上的逻辑思维,而大量数据的获取还会伴随一系列的隐私安全等问题。
那么可能的突破点在哪里? 笔者有如下两个想法,一个是让AI为AI打工。随着人为反馈的加入,AI模型本身就可以提供一定程度的人为反馈,因而其也可以作为整个AI模型人为反馈的来源。
另一个是让用户自主成为语料的不断供应者,即,通过更随意的聊天场景、更无感的信息反馈来得到更巨量的语料获取,从而满足数据规模的需求。
强大到危险的ChatGPT,会替代人类思考吗?
-
下一篇
ChatGPT强大到危险?律师:涉及价值观等问题或有法律风险
记者