阿里大模型“通义千问”终于来了,我们和它聊了聊
2023.04.07下午,阿里巴巴宣布开启语言大模型通义千问的企业邀测,正式加入大模型的竞赛中。
不过对于这款产品,官方的介绍却很少,好在,DoNews第一时间拿到了内测邀请码,让通义千问亲自来解答了关于它的许多问题。
通义千问是来自阿里巴巴达摩院的大规模语言模型,主要功能是生成与给定词语相关的高质量文本,以帮助用户提高创造力和创新能力。名字的意思,是可以广泛回答不同领域复杂和独特的问题。
而在开始界面中,可以看到写封邮件撰写短文电影脚本职场助理四个选项。
我们挨个测验了下这四个功能,首先是写邮件,我们提出需求帮我向部门主管发一封邮件,因为身体不适,下周一要请病假。
作为对比,我们也让chatGPT回答了同一问题,不难看出,通义千问的回答更符合中国人的语言风格。
在职场助理选项中,我们询问作为科技记者,我该如何报道人工智能的最新进展,有趣的是,通义千问和chatGPT的回答出现了明显的差异。
通义千问的回答更倾向于去具体做什么,而chatGPT的回答则倾向于先学习后工作,也算是些许的思维差异了。
除了上述的四项功能外,通义千问还有百宝箱,里面有效率类、生活类和娱乐类的九个不同选项,可以在更细分的领域帮助使用者。
比如商品描述生成,这就很明显是针对电商卖家,以下是它对天猫精灵生成的描述:
生活类中,菜谱的选项比较实用,但小学生作文却有点让人摸不着头脑,难道是为了给小学生减负?
还有一个常见的选项,就是续写(然后呢),我们尝试让它续写了《了不起的盖茨比》的经典开头。
在我年纪还轻,阅历不深的时候,父亲曾给我一个忠告,我至今还念念不忘。 每当你想要批评任何人的时候,他告诉我:要记住,世上不是每个人都有你这么好的条件。
从结果来看,通义千问对原文的理解比较勉强,续写更是差强人意,文学性还有待进步。不过,娱乐类的三个选项,就显得人性化了许多。
我们尝试让它夸赞下马云的长相,以下是生成的结果,似乎……也不无道理?
在最后,我们询问了通义千问对其他大规模语言模型的了解,它知道BERT和GPT,但对自己却颇具信心,认为具有更优秀的性能和更丰富的应用场景。
也希望通义千问的信心,能在未来成为现实。