DeepSeek又崩了,建议试试这个华为神器
开工大吉啊各位老宝贝。

不知道在座的吴彦祖们有没有一种感觉,总共不到半个月的春节假期,这大事儿却是一个接一个——
尤其是临放假那天,黑马左脚刚跨出公司大门,后脚DeepSeek就凭借近期发布的两款大模型,在全世界范围内开始乱杀。
先是间接导致美股暴跌;紧接着登顶中美APP Store免费榜;
又间接促使英伟达市值一夜蒸发6000亿美元,创下美国历史上企业单日最大市值损失的记录……
虽说黑马今天才来写这条,好像是有点没赶上趟……
但奈何在深度体验了DeepSeek一周后,
我着实觉得还是该在这个时间点留下些什么
用《黑神话悟空》制作人冯骥的话说:DeepSeek很可能是个国运级别的科技成果。
在下私以为,这话确实不假。
首先,可能有朋友会疑惑为什么DeepSeek能引发上述这么一连串的连锁反应?这一趴我建议大家自己打开DS先体验一下
(但现在好像又崩了,大家可以直接去最后看解决方法)
就黑马所看到的,网友已开发出DS的N种离谱玩法:
1、写代码
要求DS写Python脚本,画出红球在旋转三角形里弹跳,DS的表现吊打OpenAI-4o:
左:OpenAI-o1 右:DeepSeek
2、投资建议
当然,编程对于大模型来说只能算是小菜一碟,于是有网友想玩点花的,让DS给自己做了一份小米集团港股投资建议:
结果不仅得到了短期和中长期的看涨目标,甚至还有具体的压力位和支撑位信息……
36:这水平值5万学费。
根据这份投资建议,不难看出DS除了思维全面之外,对于基本面、技术面的分析也十分到位,在专业技能上给人一种训练有素的感觉。
既然在专业领域DS也能有不俗的表现,于是一些有想法的网友开始考虑让DS辅助一些专业工作:
3、炒股
比如有天才直接让DS在大A帮自己选股:
根据网友总结,DS推荐的票主要集中在那些已经涨了的标的上,它倒是敢给你推,就是不知道哥们儿是不是真敢用。
4、暴富指南
还有网友问DS自己要如何才能暴富,具体应该怎么操作,得到了如下建议:
有一说一,这个路径规划确实足够清晰,甚至贴心的提醒你年末记得三牲祭白虎,它真的我哭死。
5、算命
当然也有正经算命的,闲得无聊的年轻人把自己八字往DS一丢,忽悠DS给自己算个命,顺便搞搞职业规划:
DeepSeek:科学尽头是玄学,但玄学尽头还得看我。
6、写诗
除了这些,DS作为全球首屈一指的中文大模型,在诗词文学方面的造诣也不容小觑,有网友让DS写一首科幻主题的古诗《超新星客栈》:
前半部分还有点赛博与孤鹜齐飞的AI混沌感,结果到后半部分直接看得我头皮发麻。
7、赛博嘴替
前几天,OpenAI指责DeepSeek训练模型的方式是偷窃,是直接蒸馏ChatGPT的训练数据,有网友问DS对此怎么看,得到的回复如下:
其语言系统之发达让黑马望尘莫及。
而DS能在体验上做到不输GPT-4o,很大一部分原因在于其创新的大模型训练方法:
举个例子,GPT-4o采用的是给海量标注数据的填鸭式教学( SFT ),然后再拿强化学习( RL )做考前突击;而DS则是直接放弃了SFT,全靠强化学习,通过用算法给模型回答打分,再继续优化。
这种方式训练出来的模型,不仅进化速度快,关键是成本是真的低,根据官方披露的数据,DeepSeek-V3 的训练成本仅为 558 万美元,只用了2048张H100的GPU集群,用时53天;
而GPT-4的训练成本高达7800万美元。
一举打破了吃瓜群众对于AI大模型训练需要烧掉大量资金的认知。
据说,DS的成本数据披露之后,美国AI公司的高管一度陷入了如何向股东解释模型开发的巨额投入的困境中。
值得一提的是,就在前几天,美国共和党参议员乔什·霍利(Josh Hawley),提出一项新法案:美国人下载DeepSeek,将被定为犯罪,可能意味着最高20年监禁和1亿美元罚款。
而目前,美国国防部、美国国会、德克萨斯州政府、NASA、美国海军已禁止使用DeepSeek。
其中美国国会:禁止员工在官方设备上安装和使用DeepSeek。
回到DeepSeek APP本身,作为一款完全免费的AI模型APP,DS上线20天后就拥有了2000万的日活用户,成为全球增速最快的AI应用。
但另一边,在除夕当天,DeepSeek官网显示器线上服务收到大规模恶意攻击,据透露这些攻击的IP地址都在美国。
部分攻击指令详情
目前这些网络攻击仍在持续,并且还在不断升级,1月30日有2个Mirai变种僵尸网络参与攻击,分别为HailBot和RapperBot。共涉及16个C2服务器的118个C2端口。
前有爆发式增长的访问量压力,后有不明势力的恶意攻击,DeepSeek的卡顿在所难免。
包括黑马在内的编辑部同事们,这两天明显发现DS的反应变得迟缓,还经常出现服务器未响应的提示。
不得已,黑马只能通过调用其他接入DS的API的大模型,绕过攻击访问DS(不过这种方法无法联网)。
但好在,近段时间多家平台都宣布接入了DeepSeek大模型,其中包括:
2月1日上线的,华为云联合硅基流动基于华为云昇腾云服务的 DeepSeekR1/V3 推理服务;2月4日潞晨科技联合昇腾,发布基于昇腾算力的DeepSeek R1系列推理API,及云镜像服务;
2月2日,腾讯云和秘塔 AI先后宣布接入 DeepSeek-R1 模型;
2月3日,阿里云宣布,阿里云 PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1;
此外还有百度智能云千帆平台、火山机器学习平台 veMLP、火山方舟……目前都支持调用DS模型。
这段时间如果有需求的话,大家可以尝试在这些平台上调用DS绕开攻击。(如果不会操作,详细教程这两天黑马会出一个视频讲解)
其实在黑马看来,DeepSeek最大的贡献,不是它超越ChatGPT的展现效果,而是低成本的训练模型。
性价比的训练成本往往意味着开放API接口的价格也不会太高,加上DS又是一个开源大模型——
这意味着,对于中小型企业来说,无论是直接接入DS的API接口,还是利用开源模型自己训练,成本都能得到大幅度降低。
大胆推测一下,国产AI在应用层面,可能就这几个月大概率就会迎来一波爆发。
DeepSeek的爆火不止是技术胜利,更是一场底层逻辑的颠覆。而美国的禁令恰恰证明:这一次,中国AI跑在了前面。