1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

DeepSeek回答我什么是DeepSeek?

1987web2025-02-26人工智能AI11
昨天晚上,我下载了DeepSeek

昨天晚上,我下载了DeepSeek这个令全世界震惊的APP。我之所以说它令全世界震惊,是因为一些顶级的高科技公司,因为它的横空出世,而顿然经受了一场措手不及的灾难。

我从网络上的一些舆情中了解到,2025年1月27日,美国芯片巨头英伟达股价暴跌17%,市值跌去5900亿美元(约合人民币4.24万亿元)。世界富豪500强的损失规模合计达1080亿美元,其中,英伟达联合创始人黄仁勋财富缩201亿美元,降幅达20%;甲骨文联合创始人埃里森损失规模226亿美元,占其财富的12%;戴尔公司的戴尔损失130亿美元,币安联合创始人赵长鹏损失121亿美元。公开信息显示,这些公司,或多或少与AI沾边了。

对此,人们不禁要问:DeepSeek为什么这么厉害?

公开信息显示,DeepSeek来自中国杭州的一家小公司。我今天下午,通过DeepSeek问:DeepSeek目前处于AI的哪一个阶段?没想到,DeepSeek在很短的时间内,给出了详细的答案。

DeepSeek回答我,关于DeepSeek在人工智能发展阶段中的定位,需要从技术背景和目标两方面分析。

1. DeepSeek的技术定位:当前AI阶段的顶尖应用

DeepSeek(深度求索)的核心技术是大语言模型(LLM),例如其开源的DeepSeek-MoE-16b和专注推理的DeepSeek-R1系列。这些模型基于深度学习技术,尤其是Transformer架构,属于当前AI发展的第三阶段(2010年代至今的深度学习浪潮)。其特点包括——

数据驱动:依赖海量文本训练,无明确规则设计;专用性:擅长特定任务(如文本生成、代码编写),但未达到通用智能;工程优化:通过MoE(混合专家)架构提升效率,体现当前行业对模型性能与成本平衡的追求。

2. DeepSeek的目标:向AGI过渡的探索者

尽管技术基于现有框架,DeepSeek明确以实现AGI(通用人工智能)为目标,这属于理论上的第四阶段(尚未实现)。其特殊性在于:

纵向发展:不同于多数公司横向扩展应用场景,DeepSeek聚焦提升模型的通用性,例如通过增强逻辑推理(如数学问题解决)和跨领域泛化能力。

开源策略:开源模型如DeepSeek-MoE-16b,旨在推动社区协作突破现有AI局限,符合AGI研发需多方参与的特性。

3.行业对比:与DeepMind、OpenAI的异同

相同点:均将AGI设为长期目标,重视基础研究(如OpenAI的GPT-4、DeepMind的AlphaFold)。

差异点:DeepSeek更聚焦高效实现AGI的技术路径,例如通过模型架构创新(MoE)降低算力门槛,而OpenAI/DeepMind依赖大规模算力堆砌。

4. 现阶段挑战:AGI的关键瓶颈

DeepSeek虽在推进,但AGI需突破——

意识与理解:当前LLM仅是模式匹配,无真实认知。

跨模态泛化:整合视觉、语言、行动等多维度信息的能力。

自我改进机制:无需人类干预的持续学习能力。

结论

DeepSeek处于深度学习阶段的技术前沿,同时是AGI的早期探索者。其价值在于尝试通过工程创新(如MoE、推理优化)缩短现有AI与AGI的差距,但本质上仍受限于当前技术范式。真正的阶段跃迁需基础理论突破,而不仅是规模扩展。

个人认为,DeepSeek的成功,得益于换道超车。如果沿着芯片的老路去追赶人家,估计永远都追赶不上。但换一个思路,居然可以删繁就简,而且快速超越了,而且开源,让全世界免费使用。这样一来,就彻彻底底打破了过去的神话,让人们看到了一个真实的AI世界。

总而言之,高科技的发展,一旦面向了市场,开始服务各行各业的时候,于行业里的同行而言,明天究竟会发生什么,大概率是奇袭之后的防不胜防。

我个人在此,衷心祝贺DeepSeek的横空出世,亦衷心祝愿其未来越来越强大!

2025.1.28.晚上.于杭州