独家尝鲜!“十问”阿里云大模型“通义千问”,答案你给几分?
4月7日,阿里云通过其官方公众号对外宣布,阿里云的大模型通义千问开始邀请测试。南方
4月7日,阿里云通过其官方公众号对外宣布,阿里云的大模型通义千问开始邀请测试。南方+作为首批应邀测试的媒体,对通义千问提出了十问。
从相关的回答可以看出,通义千问目前已经具备了与用户对话的能力,而答案也是具有不俗的参考性,特别是对阿里巴巴集团分拆这样的行业话题,也能够较为客观的进行了分析,但是面对‘员工因加班怒怼领导’事件这种需要与热点事件进行背景结合的问题回答事,通义千问则显得较为笼统而无法结合热点事件来进行反馈。此外,面对以抖音与腾讯视频达成合作为主题,写一篇新闻报道的要求时,通义千问的回答也并没有结合到最新的新闻事实,基本上还是处于过往内容整合的阶段。
据通义千问自己介绍,作为来自达摩院的超大规模语言模型,相比于其他模型,通义千问有优势包括了大量训练数据、对话理解能力、代码写作能力、多语言支持等方面。
你对通义千问目前的能力打几分呢? 60分以下(不及格) 60-70分 70-80分 80-90分 90-100分 提交
【记者】叶丹
【实习生】顾超冉
播放
00:00
进入全屏
50
点击按住可拖动视频
【作者】 叶丹
【来源】 南方报业传媒集团南方+客户端