DeepSeek V4 与中共 AI 神话的崩解

【人民报消息】（人民报记者丽君编译报导）2025年初，中国 AI 公司 DeepSeek 凭借 R1 模型迅速打开国际知名度，一度引发美国科技与政界对中国 AI 追赶速度的高度关注。然而，一年多后，当 DeepSeek 于上周推出新一代旗舰模型 DeepSeek V4 预览版时，市场反应却远不如外界预期。原先被部分中国媒体形容为“再次震撼全球 AI 产业”的新模型，最终并未展现足以改变全球 AI 格局的突破性能力。相反，DeepSeek V4 的表现，更反映出中国 AI 产业在美国高端晶片限制、算力不足，以及原创能力受限等压力下，逐渐走向“低成本追赶”与“技术蒸馏”的发展模式。 一、技术现实：中国 AI 与美国顶尖模型仍存在明显差距 DeepSeek 此次推出的 V4 系列，包含拥有 1.6 兆参数的 V4-Pro 以及主打轻量化的 V4-Flash。官方宣称，新模型在程式生成、推理能力与 Agent（代理型 AI 任务）方面取得重大提升，但多家第三方测试机构与开发者社群的实际评价，则显得相对保留。 1. 核心能力仍落后美国第一梯队 在多项软体工程与推理测试中，DeepSeek V4 虽然已接近部分美国主流模型先前水准，但与 OpenAI、Google 等公司最新一代大型模型相比，仍可看出差距。尤其在复杂推理、多步骤逻辑处理、长文本稳定性，以及高阶 Agent 任务上，V4 的表现仍不够稳定。部分测试者指出，模型在面对模糊指令与高复杂度问题时，仍容易出现推理断裂、重复输出或内容失焦等情况。这也反映出，中国目前最先进的大模型，虽然已能在部分标准化测试接近美国产品，但在真正代表前沿能力的通用推理与创造性任务上，仍未追上美国第一梯队。 2. “冗长输出”暴露模型精炼度不足 部分 AI 评测机构也指出，DeepSeek V4 存在明显的“高冗长度”现象。简单来说，模型往往透过大量文字铺陈来提高命中率，而非以更精准、更高效的推理方式直接完成任务。这种现象在大型模型领域，通常被视为底层推理架构与训练品质尚未完全成熟的表现。虽然这类模型在部分考试型测试中可能取得不错分数，但在真实世界应用中，过度冗长不仅增加运算成本，也容易降低实用性与可靠性。 二、 “技术蒸馏”争议：中国 AI 的敏感灰色地带 DeepSeek 能够在短时间内、以极低预算开发出高性能模型，也让外界持续关注其训练方式。近年来，美国 AI 产业与政府部门多次警告，中共国部分 AI 公司可能透过大规模调用美国模型输出结果，再进行“知识蒸馏”（Knowledge Distillation）训练，以低成本模仿美国模型的推理能力。所谓“知识蒸馏”，原本是 AI 领域常见的技术手段，但若涉及未经授权、大规模抓取商业模型输出内容，便可能牵涉智慧财产权、服务条款与商业伦理问题。 1. 2.4 万个假帐号背后的数据窃取疑云 根据 OpenAI 与 Anthropic 向美国众议院提交的证词，DeepSeek 及其关联实体被指控动员大规模“数位民兵”，借助逾 2.4 万个虚假帐号及复杂的身份规避手段，对美国顶尖 AI 系统发动工业级数据收割行动。据称，相关人员透过数以千万计的对话，系统性地萃取 GPT 系列与 Claude 模型的推理逻辑、思维链路（Chain-of-Thought）以及对复杂任务的应对模式。 2. “搭便车”式跃进：创新还是镜像？ 这意味著，DeepSeek 的技术路径，在相当程度上并非奠基于底层算法的原创突破，而更像是对美国研究成果的高度系统性挪用。矽谷业界人士毫不讳言：DeepSeek 并非在自主研发 AI，而是在“镜像复制”美国 AI 的核心能力。这种依附式的研发路径，或许能带来短期的性能跃升，却难以积累真正从零到一的原创实力。一旦美国各大模型强化访问管控，中方 AI 的进步动能恐将迅速消退。 三、硬体限制下的技术选择：国产替代与现实落差 在美国对高阶 AI 晶片（如 Nvidia Blackwell 与 H200）出口限制持续收紧的背景下，DeepSeek V4 被认为转向以华为升腾（Ascend）系列为核心的运算平台。这一策略在中共官方语境中被视为“自主可控”，但也引发外界对其技术代价的讨论。 1. 性能与功耗的代价 尽管官方声明强调针对国产硬体进行了“深度优化”，业界普遍评估的现实却大相径庭：华为升腾晶片在记忆体频宽与互联效率（Interconnect）上，仍与 Nvidia 顶尖产品存在显著差距。为在此硬体条件下支撑超大规模参数模型的运行，DeepSeek 被迫对模型架构进行大幅压缩与简化。这一取舍在实际表现上留下了明显印记：超长上下文（Long-context）处理的稳定性不足，训练过程中的故障率也明显高于美国顶尖实验室的同类系统。 2. 制裁压力下的“被动自主” DeepSeek 据报婉拒了美国晶片供应商的预测试邀请，转而优先向华为、寒武纪等中国本土厂商开放早期访问权限。这种战略脱钩表面上是“技术自主”，实则是面对制裁的无奈之举。缺乏全球最顶尖运算资源支撑的情况下，中共国 AI正逐渐走向内部闭合、与全球主流技术体系渐行渐远的“孤岛化”格局。 四、商业现实：以价格换市场的突围困境 面对技术上的代差，DeepSeek祭出了一套典型的市场切入策略：以激进定价换取规模扩张。 1. 价格战的本质与局限 DeepSeek 轻量版本的 API 定价，据报仅为 OpenAI 同级产品的一小部分。这种定价策略并非源于技术效率的优势，而更像是在竞争中暂居劣势时的市场生存策略。在无法以纯粹技术实力争夺高端市场的情况下，中共国企业只能以低价路线或依赖政府补贴的方式，来吸引对价格敏感、对性能要求不高的低端开发者。 2. 矽谷与华盛顿的审慎乐观 据报导，DeepSeek 新版本发布后，美国科技与政策圈普遍流露出一种谨慎的宽慰情绪。其背后的逻辑在于：此次发布的实际表现，在业界看来并未构成对美国 AI 核心优势的根本性挑战。DeepSeek 固然是一个不容小觑的商业竞争者，但要撼动全球 AI 实力的既有格局，实现真正意义上的“代际超越”，目前的证据尚不充分。 五、结论：“国产之光”的光环与局限 综合以上各面向的分析，DeepSeek 的最新进展并未如官方宣传所称，实现真正意义上的“弯道超车”。它的出现，更像是中国 AI 发展现状的一个高解析度切片：技术层面：它仍是一个追赶者，且追赶的步履因硬体短板而愈发沉重。伦理层面： “知识蒸馏”与大规模数据抓取的指控挥之不去，国际社会的审查压力与潜在制裁风险正在持续升高。战略层面：它所开辟的，是一条“低价可用、难以领先”的竞争路径——在这条赛道上，性价比是唯一的筹码，而非技术实力。对于北京而言，DeepSeek或许足以完成“国产替代”的政策目标，但对于真正代表人类文明前沿的通用人工智慧（AGI）竞赛中，一款在技术来源存疑、硬体掣肘明显的条件下产生的模型，距离真正的竞争制高点，仍有相当长的路要走。（人民报首发） https://www.bloomberg.com/news/articles/2026-04-24/deepseek-s-long-awaited-new-model-fails-to-narrow-us-lead-in-ai 本篇改写源自彭博社（Bloomberg）的资深记者 Edwin Chan2026年4月24日的报导，原文标题“DeepSeek’s Long-Awaited New Model Fails to Narrow US Lead in AI”( DeepSeek 备受期待的新模型，未能缩小与美国在AI领先地位的差距)△