将AI大模型引入终端,高通混合AI引领下一个时代【4299起】OPPOFindX6系列手机5G智能oppofindx6pro年度影像旗舰FindX612G+256G飞泉绿5G全网通官方标配京东好评率94%无理由退换【4299起】OPPOFindX6系列手机5G智能oppofindx6pro年度影像旗舰FindX612G+256G飞泉绿5G全网通官方标配¥4499
随着下半年的到来,搭载下一代旗舰芯片的新机很快就要与消费者见面了。以往我们在畅想下一代智能手机之时,大家最感兴趣的还是性能、功耗、游戏、拍照等等,但今年有点不同寻常,当下正处于智能手机AI体验变革的前夜,或许下一刻,一台真正的万能助手就将来到我们身边。
不要认为笔者说得夸张,想一想ChatGPT是如何在短短两个月就实现月活用户突破一亿?再想一想互联网大厂齐聚生成式AI赛道,AIGC应用又是如何一夜之间成为行业新风口的?只能说技术发展的太快,改变往往只是一瞬间的事情。

当然,好的前景是一回事,能否实现快速落地就是另外一回事了,毕竟这需要厂商和开发者以及整个行业的共同努力才行。好消息是,在生成式AI探索最前沿,我们不仅看见了OpenAI、微软、谷歌、百度、阿里等国内外科技企业的身影,同样还有高通这样的全球知名芯片厂商,在为AI规模化发展添砖加瓦,种种表现似乎都在告诉我们一件事:这次是要玩真的了。
推动AI规模化发展,混合AI是趋势
一般来说,AI处理通常会部署在云端和终端侧,其中像ChatGPT这类大家熟悉的生成式AI应用,其背后需要动辄数十亿参数的各类大模型作为支撑,而AI大模型越复杂,越需要大量的计算资源和更长的训练时间,因此几乎都在云端部署运行。
但无论是在云端进行AI训练,还是执行大模型处理,都是一个不小的成本,特别它的推理成本是随着日活用户数量以及使用频率增加而增加的,很显然,这会是一个极高的成本,也并不利于AI规模化发展。

基于这样的现状,高通在不久前正式发布《混合AI是AI的未来》白皮书,自此,混合AI开始走向台前。
所谓混合AI,简单理解就是在云端和边缘终端(智能手机、PC、汽车以及其他终端设备)之间分配并协调AI工作负载,从而实现更强大、更高效且高度优化的AI。
在高通看来,混合AI在成本、能耗、性能、隐私、安全和个性化方面有着显著优势,并且几乎适用于所有生成式AI应用和终端领域。
仍旧以成本为例,生成式AI搜索可以提供出色的用户体验和搜索结果,但它的成本也是传统搜索方法的10倍,随着用户数量和查询次数的增多,企业运营成本将会是一个天文数字,而且这还不包括硬件、数据中心场地、能耗、运营、额外带宽和网络传输的成本,如果都算上,成本还会持续增加。
混合AI则不同,目前全世界有数十亿台已部署或者具备AI能力的终端设备,这些终端设备能够独立,或者与云端协同,主动承担起相当大一部分计算负载,如果是智能手机、PC等设备生成文本或者图片,成本将会非常低,甚至没有成本。从这一点就不难发现,相比单一的云端AI,混合AI策略确实更有利于推动AI规模化发展。
下沉终端,高算力平台是关键
当然,依靠混合AI策略实现AI规模化扩展,关键在于终端一侧。云端不受设备体积和功耗限制,因此可以提供足够算力。但终端设备却不在此列,试想,如果让手机跑大模型,发热和续航会是一个令人头疼的问题。
但这个问题并非无解,仅从手机行业来看,高通其实已经取得了一些突破。此前,高通AI Research利用高通AI软件栈执行全栈AI优化,这一全栈优化最终让Stable Diffusion能够在智能手机上高效运行,在15秒内执行20步推理,生成一张512x512像素的图像。
全球首个运行在Android手机上的Stable Diffusion终端侧演示
Stable Diffusion是一个基于输入的文本生成图片的AI模型,它的参数超过10亿,这样的参数规模过去只能在云端计算集群内运行,如今能够在手机终端运行,除了结合高通AI软件栈和AI Studio提供全栈AI能力和优化外,高通AI引擎强悍的AI性能同样不容忽视。
全球最快的手机上的ControlNet终端侧演示
值得一提的是,在刚刚结束的2023世界人工智能大会,高通首次展示了全球最快的手机端ControlNet用例演示,该模型有15亿参数,并可以完全在手机上运行,只需不到12秒就能生成一张AI图像。
其实高通并非AI领域的新玩家,早在2015年的骁龙820芯片上,就已经推出了高通第一代AI引擎,从此之后,AI就和智能手机紧紧绑定了在一起,从视频拍照到语音助手,从系统资源调度到温度控制,从信号增强到网络稳定,几乎都有AI的影子。

去年,高通正式发布了第二代骁龙8移动平台,它搭载最新的高通AI引擎,全新升级了Hexagon处理器,提升了分组卷积、激活函数加速和Hexagon张量加速器的性能,支持微切片推理和INT4硬件加速,从而可以快速高效地运行Transformer网络,以及前面提到的,行业内率先在终端侧支持Stable Diffusion、ControlNet等生成式AI用例。
目前,第二代骁龙8移动平台已经可以支持参数超过10亿的AI模型运行。未来几个月内,随着终端侧处理能力的持续提升,更将有望支持拥有100亿或更高参数的模型在终端侧运行,为智能手机搭载生成式AI应用铺平道路,进一步激发混合AI的潜力。
助力AI发展与应用,高通优势突出
和很多互联网科技企业不同,高通在AI领域具有自己独特的优势,作为业界领先的芯片厂商,高通业务遍布全球以及各个行业,采用高通解决方案的终端设备规模十分庞大,每年还有每年有数亿台的新终端还在进入市场,在众多设备中,除了智能手机外,更有汽车、XR头显与眼镜、PC以及其他物联网终端,完全满足终端侧AI大规模落地的需求。

此外高通还为此开发了高通AI软件栈(Qualcomm AI Stack),为OEM厂商和开发者提供一套完整的AI解决方案,它集成所有AI框架、开发者库、操作系统的整合平台,也同时具备了一次开发,多终端使用的特点,为AI由单一终端扩展到其他各种终端提供了便利。

与此同时,高通在无线领域堪称难逢敌手,高通最新的5G芯片骁龙X75,已经5G-Advanced扩展至手机、汽车、卫星通信、计算、工业物联网等全部关键垂直领域,而AI与5G的结合还将催生出更多新的应用场景,为传统行业带来新的发展机遇。
总的来说,混合AI是基于高通自身优势而来的一种策略,与生成式AI未来的发展路径高度吻合。相信随着AI大模型参数越来越小,以及终端AI能力的不断增强,混合AI架构将真正推动人工智能走进千家万户,惠及百业千行,真正创造一个触手可及的AI世界。
1数据隐私保护
AI模型需要使用各种数据进行训练和预测。为了保护数据隐私,应该采取一系列措施,如数据加密、数据去标识化、数据分析等,从而确保数据不被泄露或滥用。此外,还应该制定数据使用和共享的规范,明确数据使用的目的和范围,避免数据被滥用或非法使用。
2模型鲁棒性
关于为AI模型创建一套安全标准的建议
为AI模型创建一套安全标准是保障人工智能系统安全的重要措施。在实践中,AI模型的安全性往往涉及多个方面,如数据隐私、模型鲁棒性、模型解释性、能源效率等。因此,为

【教程】开始使用spellworkplaces和IPU运行AI模型
如果你希望从一开始就训练最先进的模型,你可以在IPU上启动并运行我们易于使用的BERT微调快速入门notebook,无需离开Spell的Web控制台。
相关文章
- DeepSeek再刷屏!登顶APP下载排行榜,算力板块应声下跌,后市如何看
- 算力成本降十倍,DeepSeek如何改写AI投资版图?
- 学而思官宣接入DeepSeek:现面向全国中小学生免费开放
- 新学期,多所高校上线“满血版”DeepSeek
- 警惕!可能是病毒!不要从这些渠道下载DeepSeek→
- 上线一个月App下载量超1.1亿!DeepSeek下周起再开源5个代码库
- 广西宾阳县委书记回应“要求下载DeepSeek等软件”:正常鼓励大家
- 韶关学院联合腾讯云推出DeepSeek-R1“满血版”,升级校园智能服务…xoooo
- 惊喜!DeepSeekAPP正式上线,iOS和安卓版本均有
- “DeepSeek告诉我得用什么药……”人工智能生成处方靠谱吗?