【人民报消息】(人民报记者
丽君编译报导)2025年初,中国 AI 公司 DeepSeek 凭借 R1 模型迅速打开国际知名度,一度引发美国科技与政界对中国 AI 追赶速度的高度关注。然而,一年多后,当 DeepSeek 于上周推出新一代旗舰模型 DeepSeek V4 预览版时,市场反应却远不如外界预期。
原先被部分中国媒体形容为“再次震撼全球 AI 产业”的新模型,最终并未展现足以改变全球 AI 格局的突破性能力。相反,DeepSeek V4 的表现,更反映出中国 AI 产业在美国高端晶片限制、算力不足,以及原创能力受限等压力下,逐渐走向“低成本追赶”与“技术蒸馏”的发展模式。
一、技术现实:中国 AI 与美国顶尖模型仍存在明显差距
DeepSeek 此次推出的 V4 系列,包含拥有 1.6 兆参数的 V4-Pro 以及主打轻量化的 V4-Flash。官方宣称,新模型在程式生成、推理能力与 Agent(代理型 AI 任务)方面取得重大提升,但多家第三方测试机构与开发者社群的实际评价,则显得相对保留。
1. 核心能力仍落后美国第一梯队
在多项软体工程与推理测试中,DeepSeek V4 虽然已接近部分美国主流模型先前水准,但与 OpenAI、Google 等公司最新一代大型模型相比,仍可看出差距。
尤其在复杂推理、多步骤逻辑处理、长文本稳定性,以及高阶 Agent 任务上,V4 的表现仍不够稳定。部分测试者指出,模型在面对模糊指令与高复杂度问题时,仍容易出现推理断裂、重复输出或内容失焦等情况。
这也反映出,中国目前最先进的大模型,虽然已能在部分标准化测试接近美国产品,但在真正代表前沿能力的通用推理与创造性任务上,仍未追上美国第一梯队。
2. “冗长输出”暴露模型精炼度不足
部分 AI 评测机构也指出,DeepSeek V4 存在明显的“高冗长度”现象。
简单来说,模型往往透过大量文字铺陈来提高命中率,而非以更精准、更高效的推理方式直接完成任务。这种现象在大型模型领域,通常被视为底层推理架构与训练品质尚未完全成熟的表现。
虽然这类模型在部分考试型测试中可能取得不错分数,但在真实世界应用中,过度冗长不仅增加运算成本,也容易降低实用性与可靠性。
二、 “技术蒸馏”争议:中国 AI 的敏感灰色地带
DeepSeek 能够在短时间内、以极低预算开发出高性能模型,也让外界持续关注其训练方式。
近年来,美国 AI 产业与政府部门多次警告,中共国部分 AI 公司可能透过大规模调用美国模型输出结果,再进行“知识蒸馏”(Knowledge Distillation)训练,以低成本模仿美国模型的推理能力。
所谓“知识蒸馏”,原本是 AI 领域常见的技术手段,但若涉及未经授权、大规模抓取商业模型输出内容,便可能牵涉智慧财产权、服务条款与商业伦理问题。
1. 2.4 万个假帐号背后的数据窃取疑云
根据 OpenAI 与 Anthropic 向美国众议院提交的证词,DeepSeek 及其关联实体被指控动员大规模“数位民兵”,借助逾 2.4 万个虚假帐号及复杂的身份规避手段,对美国顶尖 AI 系统发动工业级数据收割行动。据称,相关人员透过数以千万计的对话,系统性地萃取 GPT 系列与 Claude 模型的推理逻辑、思维链路(Chain-of-Thought)以及对复杂任务的应对模式。
2. “搭便车”式跃进:创新还是镜像?
这意味著,DeepSeek 的技术路径,在相当程度上并非奠基于底层算法的原创突破,而更像是对美国研究成果的高度系统性挪用。矽谷业界人士毫不讳言:DeepSeek 并非在自主研发 AI,而是在“镜像复制”美国 AI 的核心能力。这种依附式的研发路径,或许能带来短期的性能跃升,却难以积累真正从零到一的原创实力。一旦美国各大模型强化访问管控,中方 AI 的进步动能恐将迅速消退。
三、 硬体限制下的技术选择:国产替代与现实落差
在美国对高阶 AI 晶片(如 Nvidia Blackwell 与 H200)出口限制持续收紧的背景下,DeepSeek V4 被认为转向以华为升腾(Ascend)系列为核心的运算平台。这一策略在中共官方语境中被视为“自主可控”,但也引发外界对其技术代价的讨论。
1. 性能与功耗的代价
尽管官方声明强调针对国产硬体进行了“深度优化”,业界普遍评估的现实却大相径庭:华为升腾晶片在记忆体频宽与互联效率(Interconnect)上,仍与 Nvidia 顶尖产品存在显著差距。为在此硬体条件下支撑超大规模参数模型的运行,DeepSeek 被迫对模型架构进行大幅压缩与简化。这一取舍在实际表现上留下了明显印记:超长上下文(Long-context)处理的稳定性不足,训练过程中的故障率也明显高于美国顶尖实验室的同类系统。
2. 制裁压力下的“被动自主”
DeepSeek 据报婉拒了美国晶片供应商的预测试邀请,转而优先向华为、寒武纪等中国本土厂商开放早期访问权限。这种战略脱钩表面上是“技术自主”,实则是面对制裁的无奈之举。缺乏全球最顶尖运算资源支撑的情况下,中共国 AI正逐渐走向内部闭合、与全球主流技术体系渐行渐远的“孤岛化”格局。
四、 商业现实:以价格换市场的突围困境
面对技术上的代差,DeepSeek祭出了一套典型的市场切入策略:以激进定价换取规模扩张。
1. 价格战的本质与局限
DeepSeek 轻量版本的 API 定价,据报仅为 OpenAI 同级产品的一小部分。这种定价策略并非源于技术效率的优势,而更像是在竞争中暂居劣势时的市场生存策略。在无法以纯粹技术实力争夺高端市场的情况下,中共国企业只能以低价路线或依赖政府补贴的方式,来吸引对价格敏感、对性能要求不高的低端开发者。
2. 矽谷与华盛顿的审慎乐观
据报导,DeepSeek 新版本发布后,美国科技与政策圈普遍流露出一种谨慎的宽慰情绪。其背后的逻辑在于:此次发布的实际表现,在业界看来并未构成对美国 AI 核心优势的根本性挑战。DeepSeek 固然是一个不容小觑的商业竞争者,但要撼动全球 AI 实力的既有格局,实现真正意义上的“代际超越”,目前的证据尚不充分。
五、 结论:“国产之光”的光环与局限
综合以上各面向的分析,DeepSeek 的最新进展并未如官方宣传所称,实现真正意义上的“弯道超车”。它的出现,更像是中国 AI 发展现状的一个高解析度切片:
技术层面: 它仍是一个追赶者,且追赶的步履因硬体短板而愈发沉重。
伦理层面: “知识蒸馏”与大规模数据抓取的指控挥之不去,国际社会的审查压力与潜在制裁风险正在持续升高。
战略层面: 它所开辟的,是一条“低价可用、难以领先”的竞争路径——在这条赛道上,性价比是唯一的筹码,而非技术实力。
对于北京而言,DeepSeek或许足以完成“国产替代”的政策目标,但对于真正代表人类文明前沿的通用人工智慧(AGI)竞赛中,一款在技术来源存疑、硬体掣肘明显的条件下产生的模型,距离真正的竞争制高点,仍有相当长的路要走。
(人民报首发)
https://www.bloomberg.com/news/articles/2026-04-24/deepseek-s-long-awaited-new-model-fails-to-narrow-us-lead-in-ai
本篇改写源自彭博社(Bloomberg)的资深记者 Edwin Chan2026年4月24日的报导,原文标题“DeepSeek’s Long-Awaited New Model Fails to Narrow US Lead in AI”( DeepSeek 备受期待的新模型,未能缩小与美国在AI领先地位的差距)△