DeepSeek,突传重磅!
作者丨孔海丽 编辑丨骆一帆黎雨桐 市场动向方面,2月3日,港股蛇年首个交易日,三大指数一度猛烈下跌,随后触底反弹,截至收盘,恒生指数微跌0.04%,报20217.26点;恒生国企指数涨0.03%,报7384.11点;恒生科技指数涨0.29%,报4737.46点。 受DeepSeeK利好提振,港股AI概念股、芯片股全天走强。其中阿里巴巴涨超6%,中芯国际涨超10%,金山云大涨超31%股价创历史新高。 从2024年12月发布V3大模型,到最近推出R1模型和多模态模型Janus-Pro,DeepSeek持续出圈,形成了全球AI界甚至整个科技圈的“DeepSeek现象”。 多次采访马斯克等AI企业家的知名播客主持人莱克斯·弗里德曼(LexFridman),用了一个词叫做“DeepSeek时刻”来描述,“我认为5年后它仍将作为科技史上的关键事件被人们铭记。” 网友让DeepSeek作诗图/潮新闻 DeepSeek不仅提供了新的AI技术路线,更重要的是,它在硅谷和华尔街联合主导的AI叙事铁墙上撕开了一道口子。 但我们在自豪和兴奋之余,还是要保持清醒的头脑。且不说,在资金、技术、人才等方面, 在“DeepSeek现象”推动下,未来的算力图景,并非单一曲线绘就。 一方面,像DeepSeek这样的产品,更高流量、更低开发和消费成本,可能带来AI应用的突然爆发,这是所有从业人员梦寐以求的场景。 另一方面,当训练成本下降刺激更多公司入场,消费者应用呈指数级增加,催生AI生态链全面繁荣,芯片需求将迎来超乎预期的增长。 硬币两面,恰好构成了算力命题的悖论。 业内人士援引腾讯之前发布的白皮书,AIAgent应用要实现跳跃式增长乃至爆发,必须闯过三关:场景渗透率大于15%、任务完成度大于80%、用户信任度大于60%。 仅以信任度为例,此前Gartner的一项抽样调查显示,64%的人表示,不希望在客户服务中使用人工智能。 目前AIAgent应用的技术能力仅满足简单场景,如客服、日程管理等。而复杂决策如医疗咨询、法律建议等,仍存在难以填补的缺陷。AI最大的应用场景是教育、医疗、金融等,但是,误诊率5%的AI医生看病,依然很难被接受。就好比,无人驾驶比人类更安全,但无人驾驶每出现一次事故都会被凝视被放大。人类对AI的信任,只是处于初始水平,此外还面临着各国隐私保护法规、用户习惯、能源约束、技术路线分歧、多智能体协作、伦理困境等方面的挑战。 业内此前预计,要到2026年前后,才将出现AI信任度的分水岭(大于60%)。“DeepSeek现象”会不会加快这个时间表的到来?现在没有人能够断定。 有人说,2025年将是AIAgent应用元年。而DeepSeek通过异构计算架构、CPU+FPGA+ASIC混合部署和动态负载均衡算法等创新,将单位算力产出提升2倍多,这是否意味着它探索的技术方向将打破算力垄断,导致算力过剩? 这关系到算力现状。其特点是严重不均衡。一是地区不均衡。北美尤其是美国占据了全球算力最大份额,其次是中国,但高端算力基本集中在北美。 二是供应不均衡。通用算力芯片厂商主要是英伟达,占据70%以上份额,2025年其GPU销量预计可达700万块;BSIC芯片的主要厂商是博通和Marvell,合计占有超60%的份额;云计算方面,谷歌、微软、亚马逊占据全球65%的市场份额。这就是大家所说的算力垄断。 三是企业不均衡。微软、Meta、谷歌、亚马逊、xAI几大巨头目前囤积的算力总共约合355万块等效H100,这还不包括AI新贵OpenAI在内。其他经济体企业能拿到的芯片量,无法与之相比。 算力供需还存在结构性错配的问题。从纵向看,随着多模态应用的普及,推理侧的算力需求增速已经超过训练侧,但算力还主要布局于训练侧,调整需要一点时间;从横向看,大量算力被消耗在数据清洗和模型调试等非核心环节。 以大模型算力为例。2024年下半年以来,大模型算力已经从训练向推理转移,其中占据推理算力市场最大份额的,仍然是英伟达。 《中国算力发展报告(2024)》援引援引IDC报告,截至2023年四季度,英伟达GPU全球市场份额达95.9%,英特尔和AMD在CPU市场合计占比89.2%。英伟达通过在CUDA和GPU两端同时发力,构筑了软硬协同的护城河。有人说DeepSeek通过架构革新,绕开了CUDA,冲破了它的护城河,这其实是误读。多位专家研读DeepSeek公开(开源))论文后表示,V3、R1的底层架构仍然是基于CUDA生态建构。 至于算力过剩,短期内不存在,整体上仍然是供大于求。《中国算力发展报告(2024)》援引中国信通院数据,截至2023年底,全球算力规模同比增长40%,但以CPU为代表但芯片年性能提升不足15%,无法满足视频、图片等非结构化数据的处理需求。赛迪智库2024年初测算,2023年中国智能算力需求达123.6EFLOPS,但智能算力供给规模仅为57.9EFLOPS,严重供不应求。“DeepSeek现象”目前看来是增加了而不是减少了硬件需求。比如,32G的英伟达RTX50系显卡,近半个月涨势凶猛,最高已经炒到了6万元以上。其中部分原因在于,消费者购入RTX50显卡去做DeepSeekV3、R1本地化部署。 既然DeepSeek尚未突破硬件限制,所做的也是巨人肩上的创新,但为什么还是引起美国AI巨头的焦虑甚至恐慌? 从表层看,美国AI巨头嗅到了危机,不是因为技术被超越,而是实现目标的技术路径变了,新创企业有了更多选择。就像燃油车时代比拼的是发动机,电动车时代比拼的是电池管理技术。DeepSeek证明了硅谷堆硬件堆数据的路线不是唯一选择,高效用好现有资源同样能打。 DeepSeek省钱省力的R1模型发布时,刚好是OpenAI、软银、英伟达等科技巨头宣布5000亿美元算力基建——星际之门计划的时间段,放在这个背景下对比来看,美国AI巨头的刺痛感就更强烈了。 一位资深AI观察人士告诉21世纪经济报道记者,DeepSeek发起的这场“效率革命”,是AI发展从技术理想主义转向工程实用主义的标志性事件。它证明了,在现有硬件和物理约束条件下,通过计算拓扑结构优化获得的边际收益,远高于单纯增加芯片数量的线性增长。 这解释了为何美国AI巨头会产生战略焦虑的深层因素——当工程创新能力开始在AI竞争中脱颖而出,硅谷长期主导的技术先发优势就面临重估,而且它也将带来AI叙事的重估,背后是资本和资本市场的重估。 宏观趋势研究学者、经济学家DavidWoo近日接受访谈时表示,过去两年,人们一直在谈论美国经济的“例外主义”,而AI是推动这一论断形成的重要因素。美股市值占全球资本市场的份额达63%,其中ChatGPT出现后的两年,就增加了10个百分点,而七大科技巨头又占美股市值的25%。这些巨头正是依靠AI技术的强大优势巩固了它们的地位,从而间接巩固了美国资本市场的优势地位。 因此,AI与美国科技巨头、资本市场其实是捆绑在一起的,也正是硅谷和华尔街联合主导了全球AI叙事。 如今,来自东方的神秘力量DeepSeek向这套AI叙事发起了冲锋。全球科技和资本领域持续10多天的热烈反应,可以从侧面解释科技巨头的焦虑和资本市场为何如此紧张。截至2月3日美股盘前,英伟达股价自1月24日以来已跌去20%。当然,这不排除是投资者市场(避险)情绪的短期波动。 前述资深AI分析人士认为, 在现实层面,DeepSeek也揭示了一个残酷的真相: 如果跳开地缘政治谁赢谁输的问题,仅仅着眼于行业本身,商业本质在于,赚钱的公司才能活下去。当资本泡沫退去,或许我们会发现,技术强大固然重要,但应用和生存才是企业当下的现实,也是所有AI企业的必答题。 从“谁能烧钱造最大模型”,过渡到“谁能用最少钱办最多事”;美国依然掌握着最先进的芯片,但中国找到了更省钱的玩法——这才是DeepSeek重新书写的AI叙事。 毕竟,不是所有新创企业都像OpenAI、xAI动不动就能融资到60亿美元。正是在这个意义上,DeepSeek的技术路线,受到全球大批AI企业的效仿,其开源策略受到全球研究机构的称赞,其价格策略引发全球消费者的热捧。 高效率低成本的技术创新,加上全球关注的巨大流量,让DeepSeek赢得了宝贵的时间窗口。这是堆积美元也难以买到的,也是OpenAI、Anthropic等AI新创企业羡慕甚至嫉妒的。 如果说2023年是生成式AI元年,那么2024年及之后更长的时间则是AI大模型的应用落地爆发周期,AI大模型从技术浪漫走向产业应用,推动生产效率提升、业务场景拓展与增长。 面向未来的产业探索之路,不仅需要指南针,企业更需要导航仪, 《激活:AI大潮下的新质生产力》 主编:秦朔 出版社:中信出版社 现在,21君给大家谋福利啦,免费送书! 在本文留言,获得 我们将在本文留言区公布获奖名单哟~获得赠书的小伙伴记得按照时间留下你的地址。 本期编辑黎雨桐