理解AI算法模型崛起的十个前提问题
原标题:理解AI算法模型崛起的十个前提问题
【编者按】
基于大、中、小模型,从GPT时代下基础算法、通用算法和应用算法之间的重要关系,模型算法的发展历程和重要意义,算法与算量、算力之间的互动关系三大方面来看,当下正是人工智能行业的重要转折点,算法在行业场景问题解决、驱动算量和算力高效发展、实现城市精准科学治理等方面扮演着重要角色。在这样的转折点,BPAA第三届应用算法实践典范将得到更多支持,有更好的发展机遇,也将链接更多市场需求。基于此,零点有数董事长袁岳对理解AI算法模型的十个前提问题进行了阐述。本文经环球网、中国日报网、中国网、中华网、金融界、亿欧网、极客公园等权威媒体刊载。
一、常模与建模的分野
人们在诸多场景中建设了大家广为接受的基础模型,作为我们进行分析运筹的逻辑工具,所以我们习惯了在心理测量、经济预测、工程计算、实验管理形成的通用模型。而AI中的应用算法模型来自于人们对于业务经验、科学运算、专业处理技能的逻辑提炼和模式化构建,透过持续的训练提升其精度,因此即使不能成为常模,但也可以在解决特定场景问题上发挥相对稳定的分析、预测、判断、推荐、搜索、匹配、对策作用。当然与常模相比较,AI建模有更多的模型选择,也形成功能和精确度差异很大的模型分布。
二、大中小模型关联
基于特定垂直场景数据的小模型建设构成了算法模型预训练的第一步,特定垂直领域的小模型积累与集成、生成导致中模型的成型,而大模型并非只是一种巨大的模型,它本身也可以看成是在中小模型预训练累积、机器学习与多模态生成能力基础上构建的生态型算法模型集成机制。我们今天需要形成起码的小模型开发能力,在中模型领域形成实际的操作能力,再迈向具有实际意义的大模型建设。
三、一二三层楼模型支持机制
如果我们把基础算法作为我们得以展开技术建模的算法基本工具库看成一层楼,那么通用算法就是二层楼,而GPT类的大模型建设为我们开发应用算法累积了足够强悍的二层楼机制,它不仅为很多主体提供了便捷的问题探索解决方案,还为处在三层楼的我们在特定领域开发垂直应用算法提供了高效的支持。
四、平台与内容加载
在数字化建设的第一步,很多单位建设了相应的管理系统和平台,但是在摸清底数、选择关键问题、获得场景数据、洞察问题症结、设计相应对策、匹配适当方案、预警预测未来演变方面,这需要基于数据来智能化解决问题,由问题集成、走向数据集成、算法集成的路径,衡量出我们的数字化解决方案是否有强悍的智能内核。平台建设只是我们数字化建设的第一步,无内容预期、无开发计划、无预算支持就会使得我们只有一个脑壳型的空大脑。
五、算法与算力匹配
在使用常模与简单数据呈现下形成的数字化解决方案,到基于小模型、中模型和大模型的解决方案,这意味着完全不同的算力配置需要和数据支持需要,因此当算法模型发育的条件下,就需要算力配置与数据调度机制相应调整。应用算法驱动的算力、算量匹配解决方案往往成本效用比最优。
六、业务因素与技术因素的建模价值
模型不只是技术作品,也难以只依靠原有的业务经验积累解决问题,我们把AI建模解构为选题、解析、架构、提炼、模式化、程序化等关键步骤,这些步骤让我们看到AI模型训练是一个融业务经验透视、关键元素及其关系设置、程序语言转化相结合的复合型工作。
七、TOP-DOWN与DOWN-TOP路线
这是基于核心开源技术设置大模型构架然后走向垂直场景应用,还是基于多领域垂直场景中小模型积累而走向大模型架构建设,这可理解为AI模型建设中的两条不同路线,无疑,基于业务规模与业务基础考虑,大厂与校园团队通常会选择TD路线,但DT路线可能提供更多有可感度的解决方案。
八、模型流动性与数据流动性
AI领域中算法模型不仅重要,而且算法模型的特点也决定了其非开源分享很难发挥弥散作用,算法先行使得更为实用、经济与可控的数据调度应用才成为可能,在严紧的数据安全规范下,与数据作为交易要素相比较,算法的交易可能性更大,未来是算法模型的流动性带动数据应用的流动性,而且算法模型的流动限制性也许远小于对于数据流动的限制性。
九、工作量与预算
应用算法模型建设面临问题多、场景细碎丰富、数据可访问性不足、可用人才稀少和系统适配遇到较多障碍的情形,由于公共部门和私营部门普遍缺乏对算法模型的基础认知,因此目前数字化建设预算机制上,算法模型面临无预算、相关预算无法单独提报的难题,从系统开发商、算力供应商、大数据治理服务供应商手上分劈预算难度极大。算法预算需要被提升到与算力预算、算量预算相匹配的位置。
十、模型建设与模型人才培养
算法模型领域的前进步伐需要更多实用的前沿人才提供支撑,而现有人才教育机制的滞后性需要算法模型行业积极投身到算法模型人才培训的一线,提供从系统概念、开发技能,到应用方法、实案训练的全程支持。