阿里版GPT“通义千问”开启内测:九大定制场景提升亲和力
文/福布斯中国
阿里大语言模型突然亮相。
4月7日中午,阿里云宣布自研大模型通义千问开始邀请用户测试体验。公司称,现阶段该模型主要定向邀请企业用户进行体验测试,用户可通过官网申请,符合条件的用户可参与体验。
此前,业内均猜测,阿里大语言大模型将于4月11日举行的2023阿里云峰会上公布,因此并未料到今日就开放内测。
据悉,阿里达摩院在NLP自然语言处理等前沿科研领域早已布局多年,并于2019年启动大模型研发。继多模态大模型M6、语言大模型PLUG之后,阿里达摩院于2022年9月发布通义大模型系列。
从官方网站提供的职场助理电影脚本写封邮件撰写短文四个示例可以看出,阿里这个大模型主要提供的功能是问答,实现输出简单文字、故事以及资料的收集等等。本质上,通义千问就是一个大语言模型,基本功能就是文本生成。
对于命名缘由,官方并未透露。通义千问的回答是:通义千问这个名字来源于两个方面,通义意味着该模型具有广泛的知识和普适性,可以理解和回答各种领域的问题。作为一个大型预训练语言模型,通义千问在训练过程中学习了大量的文本数据,从而具备了跨领域的知识和语言理解能力。
千问代表了模型可以回答各种问题,包括常见的、复杂的甚至是少见的问题。它表达了通义千问致力于满足用户在不同场景下的需求,无论问题多么复杂或者独特。综合起来,通义千问这个名字表达了这款人工智能语言模型的强大功能和广泛适用性。
例如,网站百宝袋页面提供效率类生活类娱乐类三大类别,以及写提纲SWOT分析商品描述生成小学生作文写情书为你写诗等九大场景,供用户内测。值得注意的是,商品描述生成正与阿里的电商业务相匹配。
相比3月16日公布的文心一言,通义千问只提供了文本生成功能,并没有强调语音、图片等多模态功能,但从用户需要的场景出发,提供了易用性和亲和力。
通义千问并不完美,但其自然语言处理、上下文理解等方面的表现都中规中矩,毕竟目前仍处于内测阶段,生成式AI需要经历不断深度学习和打磨。
目前,大语言模型已成为互联网和初创企业加速布局的热门赛道。如今,百度、阿里两家都开启了大语言模型的内测,华为、腾讯等势必也不会落后太久,所以一场大语言模型的竞争热潮已经来开帷幕。