DeepSeek将陆续开源5个代码库,如何实现中国特色开源新生态?
2月21日,DeepSeek宣布将在接下来的一周开展开源周活动,陆续开源5个代码库,以完全透明的方式分享其进展。
开源,是DeepSeek一直以来的追求。正是因为此前和世界顶尖闭源模型GPT-4o不分伯仲的DeepSeek-V3上线并同步开源,一石激起千层浪。
在人工智能大模型时代,如何实现中国特色开源新生态?日前参加了2025巴黎人工智能行动峰会的清华大学苏世民书院院长、公共管理学院教授薛澜,一直关注这个问题。2月21日,在复旦大学哲学学院和《探索与争鸣》编辑部主办的DeepSeek:人工智能的中国时刻?学术研讨会上,来自薛澜团队的王哲博士就人工智能大模型时代的开源创新与治理变革做了分享。
【开源创新:从煎熬到光鲜】
马斯克在2024年曾两次起诉开发了GPT系列的OpenAI公司,指责其将最初定位的开源非营利模式转向闭源的商业化模式。
所谓开源创新,是在数字技术和数字经济领域,通过开放媒介和资源共享来实现知识创作和知识产品生产的一种创新协作活动。
回顾开源创新的历史,有一个从煎熬到光鲜的过程。王哲说。上世纪70年代,美国的贝尔实验室向学术界开放了Unix第六版,这可视为开源文化的一种早期实践。与闭源相比,开源创新可以汇聚更丰富的创新主体和生态。但由于挑战了商业化闭源模式,开源在当时并没有成为主流。
直到进入互联网时代,基于平台基础设施和新的商业模式,开源从煎熬走向光鲜。这得益于它的4个本质特征得到了非常好的发挥——应对不确定性,激励创新者群智协作,破除行业垄断,保证新技术和新兴产业在阳光下安全发展。我们现在每天都会用到的Windows操作系统、MacOS、安卓、鸿蒙乃至DeepSeek,都是基于开源创新的产品。
【开源的本质特征是否发生变化】
这就引发了一个思考:新一轮人工智能技术革命和产业变革中,开源会不会继续成功?
这其实需要我们回答,在人工智能时代,开源的4个本质特征是否发生变化?王哲说。
经典的计算机算法与外界没有信息交换,是一种闭源模式。而人工智能算法,从架构的持续学习到结果的迭代优化是无止境的,也是不确定的,因为它与外界环境的交换始终存在。从这个过程可以看到,相比于互联网时代,人工智能时代下开源创新应对不确定性的创新策略的内在逻辑并没有改变,甚至变得更加重要。
DeepSeek选择开源策略之后,世界各地的技术人员得以对其进行适应性评价,不断迭代优化算法,再开发出很多的分支版本,这正吸引和激励了群体智慧不断参与和贡献。今年1月,国际权威学术期刊《自然》关注到DeepSeek吸引了全球科学家和技术人员的注意力,为此连发两篇评论文章。可以说,在人工智能大模型时代下,开源作为激励创新者群智协作的内在逻辑没有改变。
上世纪末到21世纪初,微软俨然是个人计算机时代软件的主导者,它试图运用这种优势继续垄断刚刚兴起的互联网产业,而谷歌作为当时的挑战者,通过开源底层技术吸引开发者共建生态,同时用上层闭源服务和相关接口壁垒来巩固商业优势,成功地击破了微软的企图。OpenAI起初也声称走开源路线,但是当它处于领先地位时,又开始放弃开源路线。之后,美国的Meta公司(原名Facebook)扛起开源的大旗,也吸引了大规模追随者的注意力。如今,中国的DeepSeek作为新的挑战者入局,向学术界和产业界公布了重要研究论文和架构代码,打破了之前高算力和稠密参数权重的大模型研发路径。也就是说,开源作为挑战行业垄断者的内在逻辑没有变化。
以DeepSeek为例,它的训练路径定义了一种新的生态路径,推动了大模型技术的普惠,这无疑能够重塑人工智能前沿领域的安全格局和地缘政治格局。相较一些机构或公司声称由他们来负责人工智能安全,人们更希望看到人工智能在阳光下发展。在新一轮人工智能技术革命中,开源作为阳光策略,甚至比在互联网时代对于人工智能安全发展更加重要。
【大模型开源创新公地】
在中美博弈背景下,中国应建立怎样的开源治理模式?
大模型时代,考虑到开源内容的特殊性、开源治理的特殊性和中美竞争的特殊性,政府的参与变得更加重要,因为仅靠企业和社会组织,包括技术社群的协调,已不足以解决这样复杂的矛盾和问题。王哲说,因此建立有为政府有效市场和有机社会相互作用的开源治理模式,是实现中国特色开源新生态,实现全球性创新引领的关键。
为此,薛澜团队提出了大模型开源创新公地的概念。在此前的开源过程中,大家最关注的是相应的技术社群和市场的协调,但现在需要延伸到市场、政府的协调,以及社会、市场、政府共同发力协调。治理维度也从之前主要聚焦于技术研发和商业化,变成了产业的规模化应用,社会伦理、法律甚至国家安全。
大模型的开源创新至少包含三个环节,算力、数据和算法,每个环节都包含技术本身的治理、产业的治理、社会的治理和国家安全的治理。中国作为世界上最重要的大模型应用市场和创新研发地之一,就更加需要在技术社群和市场合作的基础上,积极探索社会、市场和政府三位一体创新公地的治理模式,才能更有效地应对大模型技术变革的挑战,从开源生态的学习者、参与者变成贡献者乃至引领者。在开源的世界,只有贡献才能够被关注,只有贡献才能够真正主导相关生态和标准。
开源创新为我们在市场、体制之外提供了实现一种技术创新组织模式的治理选择,这种选择不是对市场或政府的替代,而是相互补足、相互促进的。王哲引用哈佛大学法学院一位教授的话结束了分享。
原标题:DeepSeek将陆续开源5个代码库,如何实现中国特色开源新生态?
题图来源:上观题图
来源:作者:解放日报 黄海华