DeepSeek是小团队逆袭?错!一文看懂背后的资本与技术实力
DeepSeek全网唯一深度解读。遍地都是垃圾信息,要么就是无脑吹嘘国产AI,要么就是月亮就是西方的圆,就没有一个人客观理性讲清楚这个事情。

DeepSeek到底是什么水平?DeepSeek到底有没有偷数据?中美AI的差距到底有多大?国产AI突围的机会到底在哪里?一次性讲清楚。
一、DeepSeek是一个小企业吗?
不是。它的前身是幻方量化,是一个非常牛的母公司,也是国内为数不多的T+0级别的量化交易公司。根本不存在什么小团队打倒了大资本,人家本身就是大资本。
人家的招聘员工可以无限量使用数万个GPU,人家的年薪甚至可以超过130万美金。人家的GPU储备是国内几个除了巨头之外最多的,业内一直都知道,只不过最近才发力。
DeepSeek创始人,梁文锋
而且DeepSeek绝对不是500万美金研究出来的,500万美金只是单次训练成本,就好像一瓶矿泉水成本两毛钱,但是整个生产线可能需要2000万。但即使这样,DeepSeek的成本依然比对手低了一个数量级。
二、DeepSeek到底有没有偷数据?
偷是一个贬义词,谷歌抓取你的网站叫不叫偷你的数据?很多人怀疑它对OpenAI的数据做了蒸馏,是源于不可能用那么低的成本做出一个这么牛的产品。
但是蒸馏本身并不可耻,大部分的模型都是经过蒸馏的,比如说GPT的4o-mini 就是4o蒸馏出来的。DeepSeek伟大的地方在于它独立思考出了这个策略,并且把我的源代码公开。
DeepSeek技术文档
如果一定要说DeepSeek偷,那么它偷的应该是美国大学的策略:第一,汇聚最优秀的年轻人才;第二,为人才提供资源和自由,让他们疯狂研究;第三,专注基础研究,哪怕没有直接的商业应用或者利润。
三、那蒸馏别人这个事情对不对?
蒸馏是什么?蒸馏就是学习。牛顿用一辈子的时间研究出了三定律,你三天学会,这个就是蒸馏。你学习物理化学,就是在蒸馏物理化学。你今天背唐诗宋词,就是在蒸馏唐诗宋词。
模型蒸馏
所谓的蒸馏,本质上是一个知识产权的争议,就是学生有没有权利传授老师讲的知识。世间没有绝对的创新,包括OpenAI,它也是利用谷歌的Transformer结构,也是站到了巨人的肩膀之上。
现在的问题在于,如果你禁止别人去学,你自己应该设置一个防范机制。如果谁都可以用,那别人就可以拿走,所以更多的是一个知识产权方面的纠纷。
DeepSeek只要在论文的根本训练流程上没有造假,那么至少在强化学习这块领域是领先o1关键性的一步,这种是单靠蒸馏手段完全做不到的。
并且在部分用例上,R1已经明显地超过o1和o3-mini。你可以怀疑V3蒸馏,但是R1出来之后DeepSeek有没有蒸馏GPT无关紧要。
四、中国的AI超越美国了吗?
没有。所有告诉你AI反超美国的直接拉黑。我们对西方的态度应该是该承认的承认,该祛魅的祛魅。不要月亮都是西方的圆,也不要一味的狂妄自大。
中美AI的差距是3 ~ 5年,这一次DeepSeek的出现让时间缩短到3 ~ 5个月。美国人一直跑在前面,只是他之前看不到你人影,现在一回头发现你要追上了。
那追上有没有那么容易?也没有。因为 AI 是一个系统工程,它不仅仅是一个算法的优化,它还涉及硬件数据和软件系统,缺一不可。
在这场比赛当中,DeepSeek打了一个漂亮的翻身仗,它让美国人看到优秀的华人,可以在独立的环境之下独立解出这道题,并且率先公布结果,并且敢于把内容开源。
尽管在其他地方依旧差距很大,但是这种勇气和智慧让中国的AI不可小觑。莫欺少年穷,一个穷小子有愿景,有志气,有毅力,哪怕现在没钱,将来一定不简单。
五、那美国就一定会赢吗?
我有两个消息,一个是坏消息,一个是好消息。坏消息是很多人搞错了对手,AI的对手不是英伟达,AI的对手是其他的AI,包括美国人在内,都不希望英伟达一家独大。最想搞垮英伟达的是另外一个芯片企业。
英伟达在今天恰恰强得可怕,很多人不知道它卖的不是一个硬件,而是一整套CUDA生态圈,行业已经形成了严重的路径依赖,切换成本极高。
就像你买的苹果手机,但是不能够用iOS系统,那么你所有基于iOS系统开发的都会作废,这是最可怕的地方。
你可以开发出来一个一模一样的微信,但是你没有办法把社交关系转移过去,这个系统就是英伟达的护城河。
英伟达创始人,黄仁勋
你可以说未来新的计算方式出现,英伟达会逐渐消失,但是未来5 ~ 10年可见的时间之内,它依然是绝对的领先,并且战斗力极度强大,远没有到僵而不死的地步。
DeepSeek本质是一种节油技术,这个恰恰意味着对芯片需求的暴增。有一个词叫杰文斯悖论,当年蒸汽机的效率提升5倍,但是英国的煤炭消耗量增长了20倍。
因为效率提升,原本用不起的人用得起了,市场反而变得更大了。可见的未来,英伟达的需求会持续上涨。
好消息是说美国人赢也不一定,因为虽然生成式的人工智能是从美国实现从0到1的,但是到现在为止没有任何一个企业获得根本性的突破。
所谓的根本性的突破就是【实操】。
你听它每个功能都很牛,但是你很少见过有大规模的商业应用。它是可以写文章,但是没有大规模的商业化,它是可以做图片,但是没有大规模的商业化,它是可以做客服,但是也没有大规模的商业化。
一个东西只能停留在实验室里面,供少部分精英使用,那么它就不具备垄断优势,或者说它是无效领先。
推动人类发展的有两股力量,一股是科技的发明与创造,一股是把科技普及到每一个人。前者是从0到1,后者是从1到100,而后者恰恰是中国企业擅长的。
乔布斯发明了苹果,而国产手机把智能机普及到每一个人。马斯克创立特斯拉,而国产新能源把智能汽车普及到每一个人,降低成本和扩大市场恰恰是中国企业的优势。
六、怎么看待美国对中国AI的打压?
比赛,应该是让自己更强,而不是想着给对手去做手脚。所谓的打压本质上都是在培养新的对手。
你越是搞石油禁运,省油的车就会卖得越好。有一天你彻底断掉石油,电动车就会崛起,一直崛起到不需要你一滴油为止。
deepseek遭受大规模恶意攻击
因为这个世界上从来没有非买不可,你用它,只是因为替代的成本太高,你越是拔高成本,竞品就越有利可图。
之前为什么不做?因为利润低,没必要做,不划算。你越是对芯片禁运,DeepSeek这种高效的算法就会越占优势。你越是禁运,原本不那么强的国产芯片就越有用武之地,坦坦荡荡,公平竞争。
【本文来源@鹤老师的视频内容】