1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 短视频 > 正文

短视频

DeepSeek背景你知道多少?研发历程故事你知道吗?

1987web2025-02-23短视频5

DeepSeek的创始人是梁文锋,1985年出生于广东湛江,自幼展现出非凡的学术天赋。2002年,年仅17岁的他便考入了浙江大学电子信息工程专业,并在杭州完成了本科和研究生学业。2007年,梁文锋继续攻读浙江大学信息与通信工程专业硕士研究生,师从项志宇,主要做机器视觉研究。在浙江大学学习期间,梁文锋不仅积累了扎实的理工科与跨学科思维基础,还培养了深厚的数学建模和机器学习兴趣。

量化投资领域的成功2008年,还在读研究生的梁文锋开始探索全自动量化交易,带领团队使用机器学习等技术进行金融市场的数据分析与交易策略开发。2013年,梁文锋与浙江大学同学徐进共同创办了杭州雅克比投资管理有限公司,进一步深耕量化投资领域。2015年,梁文锋与徐进共同创办了杭州幻方科技有限公司(后更名为浙江九章资产管理有限公司),依靠数学与人工智能进行量化投资,迅速在行业内崭露头角。至2021年,梁文锋已带领幻方量化成为管理资金规模超千亿的私募基金,成为国内量化资管行业的领军人物。

从金融到AI的跨界转型

在量化投资领域取得成功后,梁文锋并未止步。他深刻意识到大规模布局AI算力的重要性,并依托母公司幻方量化的资源与技术积累,于2023年创立了DeepSeek,开启了从金融到人工智能的跨界转型。

DeepSeek致力于开发高效、高性能的生成式AI模型,以推动AI技术的普及与应用。

DeepSeek的快速发展

自2023年7月成立以来,DeepSeek在短短一年多的时间里取得了显著的进展。

2023年11月,DeepSeek发布了首个开源代码大模型DeepSeek Coder,支持多种编程语言的代码生成、调试和数据分析任务。

随后,DeepSeek又推出了参数规模达670亿的通用大模型DeepSeek LLM,以及第二代开源混合专家(MoE)模型DeepSeek-V2等。

2024年12月,DeepSeek发布了总参数达6710亿的DeepSeek-V3,该模型采用了创新的MoE架构和FP8混合精度训练,训练成本仅为557.6万美元,远低于行业平均水平。

2025年1月,DeepSeek又发布了新一代推理模型DeepSeek-R1,其性能与OpenAI的o1正式版持平,并实现了开源。

DeepSeek的技术创新与突破

DeepSeek的模型设计和训练过程采用了多项创新技术,包括混合专家架构、多头潜在注意力机制、无辅助损失负载均衡策略等。

这些技术使得DeepSeek的模型在性能和效率上取得了显著的突破,成为全球前十中性价比最高的模型之一。

DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o,展示了其强大的技术实力和创新能力。

DeepSeek的市场影响与反响

DeepSeek的快速发展和创新技术引起了业界的广泛关注和热议。

DeepSeek的开源策略和技术创新降低了AI技术的应用门槛,推动了AI行业的快速发展。

DeepSeek的成功也为中国AI技术的发展注入了新的活力和信心,展示了中国技术力量在全球竞争中的崛起和突围。