国产自研AI大模型“百花齐放”,阿里、科大讯飞将推出AI大模型
2023年无疑是人工智能的爆发年,各种基于AI的新技术如雨后春笋般拔地而出,其中AI大模型成为了全球科技公司的角逐场。简单来说,AI大模型就是基于AI的Foundation Model(基础模型),这是一种在大规模宽泛的数据上进行训练后能适应一系列下游任务的模型。AI大模型兼具大规模和预训练两种属性,面向实际任务建模前需要在海量通用数据上进行预先训练,这样才能大幅提升AI的通用性和泛化性。
但是,AI大模型需要的参数量和数据量非常庞大,以OpenAI基于深度学习的自然语言处理模型ChatGPT为例。它最初的GPT-1参数量只有1.17亿,到了2020年GPT-3发布的时候,其参数规模就达到了惊人的1750亿。如今,人工智能模型体量已跃升至万亿级参数规模,大算力、强算法共同筑起了一道高不见顶的技术壁垒,只有深耕AI赛道的大公司才有入场的资格。
根据小编整理的人工智能大事件日历,二季度华为、商汤科技、阿里巴巴、科大讯飞等国内科技公司都发布AI大模型新产品,它们的技术路线各不相同,既有采用类ChatGPT模式的,也有采用多模态混合模式的。比如华为盘古大模型就包括NLP(自然语言处理)大模型、CV(机器视觉)大模型和科学计算大模型,其中CV大模型首次兼顾图像判别与生成能力,可结合科学计算大模型对气象进行预报,这是典型的多模态混合模式。
阿里巴巴即将发布与百度文心一言类似的通义千问,这是一款类似ChatGPT的大型预训练语言模型,具有广泛的知识储备和普适性,在训练过程中学习大量文本数据,从而具备跨领域知识和语言理解能力,适用于不同场景下的需求。
科大讯飞将于5月6日发布的1+N认知智能大模型,1是指1个通用认知智能大模型算法研发及高效训练底座平台,N是指应用多个行业领域的专用大模型版本,并且将有望带来N个场景的示范性产品,或将推动AI认知大模型从可用阶段迈入常用阶段。同时据了解科大讯飞基于认知智能全国重点实验室,已在核心算法、行业数据、算力支撑及团队组建等方面建立了优势保障。
目前,我国在AI认知智能领域已取得长足进展。根据第三方研究报告显示,中国在认知智能领域论文发表量仅次于美国,相关专利数量2017年超过美日韩,产业应用也呈现出AI+教育、AI+医疗、AI+金融等领域的多点开花,技术应用探索位居世界前列。认知智能可以赋予机器理解和模拟人类行为的能力,使得机器能说会道有情感。因此认知大模型是兵家必争之赛道,包括科大讯飞在内的巨头率先布局,目前已进入成果产出期。
展望未来,随着AI大模型在千行百业的深入应用,人工智能将在垂直领域有更多的落地机会。我国也将在数字中国战略框架下,通过政策扶持助力AI技术创新和应用探索,推动整个AI产业加速驶入深水区。
-
上一篇
你应该了解的6个开源AI工具
让我们来看看几个任何人都能用的自由开源的AI工具。
-
下一篇
2023年高校毕业生预计达1158万人,创历史新高。大学生作为重点就业人群之一,历来备受社会各界关注。时值大学生就业冲刺阶段,猎聘大数据研究院推出《2023届高校毕业生就业数据报告》,研究本届毕业生(以下简称「应届生」)的就业机会,尤其在新赛道的就业契机;分析应届生求职心态、行为及进展的特点,为用人方和求职者提供决策参考,为大学生就业助一臂之力。
1、应届生职位增长情况
1)行业:能源/化工/环保应届生职位同比增长超40%,增长居行业首位
较2022届应届生职位同比增长较明显的TOP5一级行业为能源/化工/环保、医疗健康、汽车、机械/制造、电子/通信/半导体,其中能源/化工/环保同比增长为42.30%,增速最高。在全世界都提倡低碳环保、致力实现碳中和碳达峰的趋势下,能源/化工/环保的重要性日益显现。在这TOP5行业中,应届生招聘平均年薪最高的是电子/通信/半导体,为18.83万,也领先所有一级行业。
2)职类:售后技术支持、科研人员、带货直播应届生职位增长均超100%
在2023届应届生新发职位同比增长最多的三级职能TOP20中,售后技术支持、科研人员、带货直播位居前三,增长率为133.75%、130.85%、104.93%。售后技术支持在售后服务中发挥着重要作用,深刻影响着用户体验和口碑,因而需求大增。我国正从科技大国向科技强国迈进,对科研人员需求较多。当前直播和短视频成为各领域新宠,带货直播是其核心角色,备受年轻人青睐,也需要大学生的加入提升从业者的素质。在这20个职能中,应届生招聘平均年薪最高的是科研人员,为27.11万;位居第二、第三的为仿真工程师、半导体技术工程师,为24.80万、24.14 万。
2023届高校毕业生就业报告:AI大模型成新岗位增幅最高