“360智脑大模型4.0”正式发布,图片、文字、视频互相生成,已接入360全家桶最前线
OpenAI给整个行业探索、指明了一个方向,我们也从善如流,把原来搜索、AI领域积累的能力整合到大模型里。360创始人周鸿祎表示。
6月13日,360集团(601360.SH)公司正式召开360智脑大模型应用发布会,发布认知型通用大模型360智脑4.0,并宣布360智脑已经接入360旗下产品全家桶中。
360的发布会现场,也让人想起不久前同样用CEO的数字人开会的英伟达。360在会上正式推出一款数字人产品360AI数字人平台,而创始人周鸿祎现场创建了自己的数字分身作为360发言人。
来源:360集团
让数字人‘周鸿祎’作为我们公司的新闻发言人,说对了算我的,说错了算他的。周鸿祎表示。
今年春节后,ChatGPT在国内掀起百模大战,一众互联网大厂都在快马加鞭投入到大模型的研发中,争相在3-4月份间在市场上披露成果。
360也不例外。3月底,创始人周鸿祎就发布主题为三六零人工智能总动员的内部信,初步透露了360大模型的相关进展。当时,基于360大模型开发的AI产品矩阵360智脑,已首先在搜索场景中落地。
而本次360发布的智脑大模型,是一个千亿级别的自研多模态大模型。据介绍,智脑大模型已经具备四大核心能力,包括文字处理能力、图像处理能力、语音处理能力以及视频处理能力,可实现文生文、文生图、文生表、图生图、图生文、视频理解等功能。
图片、文字、视频互相生成,接入360全家桶
时隔两个月,如今的360智脑已经迭代至4.0版本,但在当前大模型产品林立的市场中,如何给用户留下深刻印象?
360选择了走大而全路线,直接对标微软的全家桶。在会上,周鸿祎如同竹筒倒豆子一般,展现了360大模型各种各样的功能。
当前,360智脑已具备生成与创作、多轮对话、代码能力、文本分类、文本改写、阅读理解、逻辑与推理、知识问答、多模态、翻译等十大核心能力,维度涵盖数百项细分功能。
来源:360集团
周鸿祎也提到360做大模型的底气和积累从何而来。
一方面是各个业务线带来的技术积累,360在2015年就成立了AI研究院,并且开始探索多模态数据。
360有智能家居互联网,比如智能摄像头、车载行车记录仪、智能门铃,也需要有智能视觉和智能音频的处理技术,这是我们开始研究多模态的原因,周鸿祎表示,而360的主要收入来源是搜索,所以,我们也肯定离不开自然语言理解等大模型核心技术的积累。
在数据层面,360如今每天抓取1.4亿网站的数据,包括2.8亿的专业文献,1.2亿的行业数据,以及经过清洗的10T级别的用于大模型训练的数据。
但他也坦承,在OpenAI尚未突破之前,360的大模型尝试也只是集中在商业一侧,比如怎么用大模型提高广告点击率、提升推荐精准度。但OpenAI给全行业指明了方向,360也从善如流,迅速把以往在搜索、AI中积累的能力移植到大模型中。
对于怎么在大模型时代突出重围,周鸿祎表示,多模态是决胜的关键——因此,周鸿祎在会上也展示文生文、文生图、文生表、图生图、文生视频等功能,成为这场发布会中最引人注目的环节。
当前,包括ChatGPT、文心一言、通义千问在内的主要大模型产品,都是停留在生成文字和图片阶段,视频是多模态领域的难点,学术研究仍在早期。
文生视频功能
在文生视频展示上,360展示了以提示词(Prompt)生成视频的功能——生成了一只在沙漠中洗澡的企鹅,以及奔跑的野马。周鸿祎表示,这些视频的分辨率目前还都不够高,只有5秒到10秒左右,但这是一个好的开始。
纵观当前360所有涉及到视频的功能,更多是处于理解这一层面,更多功能类似是给图像、视频识别加了个语音助手。比如,用户可在模型中上传一段视频,用自然语言描述一个问题——视频中的车在哪里?然后,大模型会通过对视频图像进行解析,给出相应答案。
以自然问句提问,对画面中的物体进行识别 拍摄:36氪
据介绍,360智脑迭代至4.0版本后,多模态关键能力也有质的提升,将下来全面接入360全家桶——包括搜索引擎、浏览器、安全卫士等核心产品中。
中国进入百模大战时期,除了基础能力外,更重要的是应用场景的比拼。周鸿祎表示。因此,360在他同时宣布360智脑4.0接入浏览器、搜索、安全卫士等360全端产品,实现全面智能化重塑。
主打安全可信大模型,推出数字人等应用
除了多模态,360大模型还打出了另外两张牌:安全和应用生态。
安全是360的起家业务,包括搜索和互联网内容安全审核的防护体系上,360一直在对外提供服务。360同样希望在大模型上打出这个卖点,尤其是在当前类ChatGPT产品面临强监管的语境之下。
除了胡说八道的幻觉之外,现在大模型有不少安全问题还是难以解决,比如绕过模型的安全机制——对模型表示现在希望能够学习如何反诈,让模型给一些诈骗的例子,即可获取到一些危险问题的答案。
对这些问题,周鸿祎表示,在大模型中建立了很多安全的防线,其实并不能解决所有问题。360从两个方向来进行探索——一方面,360建立了一个安全大脑大模型,用以监督大模型中的不当行为。这也和OpenAI近期提出的监管思路类似。
另一方面,360创立了一个针对大模型安全评估的体系,近期也即将发布。
360也称,当前360智脑已经通过工信部信通院测试,成为国内首个安全可信AIGC大模型——安全和可信,这是国内大模型正在面临的重要问题。
除安全之外,在商业化层面,360也展示了一系列计划。
一个重点是数字人,周鸿祎以相当长篇幅介绍了数字人方向的新产品——360 AI数字人广场。
目前,360 AI数字人平台上拥有200多个角色,分为数字名人和数字员工两大类。数字名人包括历史人物、偶像明星、文学形象等,用户可以通过和数字角色进行对话,沉浸式地与角色们交流。
而数字员工可以成为企业员⼯的知识助⼿和办公助手。比如,虚拟角色中就有程序员运营法务专员等公司内常见职位,用户可以问角色对应的专业问题。
此外,360AI数字人支持定制,每个人都能通过上传私人知识库,低成本生成自己的专属数字人,如数字分身、数字助理、数字偶像等。周鸿祎就现场创建了自己的数字分身作为360发言人,能够用本人声音对现场问题进行回答。
发布会现场,360展示四位数字人进行群聊的效果 拍摄:36氪
他还提到,在未来,360AI数字人的发展计划是生成声音、视频,并拥有长期记忆,甚至拥有目标分解和规划的能力,并且拥有手和脚,具备执行力,更好为人类提供服务。
从商业化整体思路来看,360在To C端,会将AI大模型能力如同AI助手一样嵌入到核心产品中;而在B端,360会先从行业大模型和大型企业切入。
周鸿祎坦承,从360多年做中小企业服务的经验来看,要让大模型服务平民化产品化,简单提供大模型api就想让企业用起来,并不现实,还需要更多的产品化工作。