能吹“彩虹屁”的阿里“通义千问”亮相它与文心一言这样互评
阿里在AI大模型领域的研究成果终于亮相。4月7日,阿里云宣布自研大模型通义千问开始邀请用户测试体验。现阶段该模型主要定向邀请企业用户进行体验测试,用户可通过官网申请,符合条件的用户可参与体验。消息公布后,读创/深圳商报记者收到邀请码,并与通义千问展开对话。
能写脚本,还能吹彩虹屁
据悉,阿里达摩院在NLP自然语言处理等前沿科研领域早已布局多年,并于2019年启动大模型研发。天眼查App显示,阿里巴巴达摩院(杭州)科技有限公司已申请注册多个通义万象通义晓语通义博研通义晓问通义万相商标,国际分类涉及广告销售、科学仪器、网站服务等,当前商标状态均为申请中。此外,2022年12月,阿里达摩院已成功注册科学仪器、网站服务、通讯服务类通义商标。
(通义千问回答截图)
进入通义千问官网,首页写着这样一句话:我是‘通义千问’,一个专门响应人类指令的大模型;我是效率助手,也是点子生成机;我服务于人类,致力于让生活更美好。记者用邀请码登录通义千问,从页面布局来看,上方是对话框,用户可以在对话框里输入1000字以内的指令。页面下方给出可以发出的指令建议,例如团队开发了一个对话机器人,给老板写邮件介绍写一篇短文,用故事阐释幸福的意义写一段电影脚本,讲一个北漂草根创业逆袭的故事,或者提问作为手机斗地主游戏的产品经理,该如何做成国内爆款等。
页面的最下方还具有名为百宝袋的通道,展示了通义千问搭载的9种应用,这些应用被分为3类,分别为效率类、生活类和娱乐类。比如在娱乐类中,就有彩虹屁专家写情书为你写诗3个应用,比如彩虹屁专家,当你想夸别人的一个点,却不知道怎么夸的时候,就能向它求助。
评价对手,两个大模型这样答
记者用邀请码登录通义千问,向它提了几个关于自己的问题。当被问及训练数据来自哪里、截止何时时,通义千问称,数据来自阿里巴巴达摩院,它包含了大量的语言和文本数据,包括但不限于中文、英文、日文、法文、西班牙文、德文等多种语言的文本数据;文学、历史、科学、艺术等各类话题的文本数据;以及各类专业知识和技术文档等。训练数据截止时间是2021年12月31日。
(通义千问回答截图)
相比之下,聊天机器人ChatGPT的数据库更新至2021年,上个月刚刚推出的多模态模型GPT-4的训练数据可追踪到2021年9月。而文心一言则在与记者的对话中,未透露具体时间,仅表示具体的更新时间取决于模型的复杂度和更新的频率。
在对话过程中,记者也让通义千问评价了自己在国内的对手文心一言。在被问及你比文心一言好在哪里时和文心一言比你好在哪里,它则给出了几乎一模一样的答案:大量训练数据、对话理解能力、代码写作能力、多语言支持。
(通义千问回答截图)
关于通义千问这位对手,文心一言似乎准备不足。它在回答中甚至认为它是百度开发的产品。至于这位对手表现如何,它没有直接回答,而是说:作为一个人工智能语言模型,我的设计和训练都是为了与用户进行交互,尽可能地帮助用户回答问题、提供信息和建议,从而提升用户的满意度和体验。与此同时,我也在不断地学习和改进自己,希望能够提供更加优秀的服务和体验。从答案来看,两个大模型还需要时间进一步了解对手。
(文心一言回答截图)
腾讯不急,华为看中计算的机会
对于通义千问得名的原因,阿里巴巴官方没有给出解释。当记者就该问题向通义千问提问时,它回答说,这个名字来源于两个方面,通义意味着该模型具有广泛的知识和普适性,可以理解和回答各种领域的问题。作为一个大型预训练语言模型,通义千问在训练过程中学习了大量的文本数据,从而具备了跨领域的知识和语言理解能力。千问代表了模型可以回答各种问题,包括常见的、复杂的甚至是少见的问题。它表达了通义千问致力于满足用户在不同场景下的需求,无论问题多么复杂或者独特。综合起来,通义千问这个名字表达了这款人工智能语言模型的强大功能和广泛适用性。
除了阿里和百度,业内有消息称,腾讯预计5月份将在其微信端以及QQ端全面接入名为混元的AI大模型。3月22日,在腾讯财报发布后的电话会议中,腾讯高管在谈到人工智能大模型时表示,人工智能对腾讯来说是增长的加速器,腾讯关注社交、通讯、游戏等业务,人工智能会对这些业务有加持,但是不会取代。腾讯希望做得对,而不是做得急,未来将进一步投资腾讯的基础模型,也会通过不断投入来推广新业务。
对于当前大火的AI大模型,华为创始人任正非此前在一次座谈中称,未来在AI大模型上会风起云涌。但他表示,人工智能软件平台公司对人类社会的直接贡献可能不到2%,98%都是对工业社会、农业社会的促进,AI服务普及需要5G的连接,ChatGPT对我们的机会是什么?它会把计算撑大,把管道流量撑大,这样我们的产品就有市场需求。