<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>昇腾 on GPT说</title><link>https://www.gpt-hub.top/categories/%E6%98%87%E8%85%BE/</link><description>Recent content in 昇腾 on GPT说</description><generator>Hugo -- gohugo.io</generator><language>zh-CN</language><lastBuildDate>Sat, 25 Apr 2026 08:20:25 +0800</lastBuildDate><atom:link href="https://www.gpt-hub.top/categories/%E6%98%87%E8%85%BE/index.xml" rel="self" type="application/rss+xml"/><item><title>DeepSeek-V4 解锁国产芯片：3 个突破比万亿参数更重要</title><link>https://www.gpt-hub.top/post/deepseek-v4-ascend/</link><pubDate>Sat, 25 Apr 2026 08:20:25 +0800</pubDate><guid>https://www.gpt-hub.top/post/deepseek-v4-ascend/</guid><description>&lt;img src="https://www.gpt-hub.top/" alt="Featured image of post DeepSeek-V4 解锁国产芯片：3 个突破比万亿参数更重要" /&gt;&lt;p&gt;4 月 24 日，DeepSeek 正式发布并开源了 V4 系列模型的预览版本。&lt;/p&gt;
&lt;p&gt;媒体和网友的目光，不约而同地聚焦在同一个数字上——万亿参数。&lt;/p&gt;
&lt;p&gt;但我看到的却是另一件事。&lt;/p&gt;
&lt;p&gt;在 DeepSeek-V4 的官方技术报告里，华为昇腾 NPU 和英伟达 GPU，被写进了同一份硬件验证清单。&lt;/p&gt;
&lt;p&gt;这是第一次。&lt;/p&gt;
&lt;p&gt;万亿参数级别的模型，首次在正式文档中完成了对国产 AI 芯片的&amp;quot;官方认定&amp;quot;。&lt;/p&gt;
&lt;p&gt;这个信号，比参数本身更有分量。&lt;/p&gt;
&lt;h2 id="突破一国产芯片首次进入顶级模型官方认证"&gt;&lt;a href="#%e7%aa%81%e7%a0%b4%e4%b8%80%e5%9b%bd%e4%ba%a7%e8%8a%af%e7%89%87%e9%a6%96%e6%ac%a1%e8%bf%9b%e5%85%a5%e9%a1%b6%e7%ba%a7%e6%a8%a1%e5%9e%8b%e5%ae%98%e6%96%b9%e8%ae%a4%e8%af%81" class="header-anchor"&gt;&lt;/a&gt;突破一：国产芯片首次进入顶级模型&amp;quot;官方认证&amp;quot;
&lt;/h2&gt;&lt;p&gt;以前的大模型厂商是怎么做硬件适配的？&lt;/p&gt;
&lt;p&gt;早期测试往往优先开放给英伟达、AMD 这些美系芯片厂商。国产芯片？等主版本稳定了再说吧。&lt;/p&gt;
&lt;p&gt;但 DeepSeek-V4 打破了这个节奏。&lt;/p&gt;
&lt;p&gt;在模型阶段就推进国产算力适配，这在业内是个路径上的重要变化。&lt;/p&gt;
&lt;p&gt;为什么这么说？&lt;/p&gt;
&lt;p&gt;长期以来，中国大模型厂商的训练与推理几乎全部依赖英伟达的 GPU 和 CUDA 生态。这种依赖带来的不只是成本问题——还有供应安全。&lt;/p&gt;
&lt;p&gt;如果 DeepSeek 这样一个顶级开源大模型，能够在华为昇腾生态上跑出不输于英伟达平台的推理性能，它将向整个行业释放一个信号——&lt;/p&gt;
&lt;p&gt;在大模型推理侧，国产芯片已具备承载实际商业负载的能力。&lt;/p&gt;
&lt;p&gt;这不是某个厂商的 PPT 宣传，是写在官方技术报告里的验证结论。&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;官方的认定，比参数的胜利更有分量。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;根据 IDC 最新数据，2025 年中国 AI 加速卡市场总出货量约 400 万张，国产芯片合计出货约 165 万张，市场份额首次突破四成，跃升至 41%。&lt;/p&gt;
&lt;p&gt;而华为昇腾出货量达 81.2 万张，不仅断层领跑国产厂商，还占据了国产芯片总出货量的近一半。&lt;/p&gt;
&lt;p&gt;英伟达呢？从 95% 降到了 55%。&lt;/p&gt;
&lt;p&gt;这个趋势线，比任何参数都说明问题。&lt;/p&gt;
&lt;p&gt;&lt;img alt="市场份额对比" class="gallery-image" data-flex-basis="426px" data-flex-grow="177" height="1440" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://i.ibb.co/rKRXsth9/e83b8701730f.jpg" srcset="https://www.gpt-hub.top/e83b8701730f_442463539040358936_hu_ba87fbcac0646499.jpg 800w, https://www.gpt-hub.top/e83b8701730f_442463539040358936_hu_b61bf0635f1b0fd9.jpg 1600w, https://www.gpt-hub.top/e83b8701730f_442463539040358936_hu_9b41bc1f0062fde4.jpg 2400w, https://i.ibb.co/rKRXsth9/e83b8701730f.jpg 2560w" width="2560"&gt;&lt;/p&gt;
&lt;h2 id="突破二超节点方案如何弥补单卡差距"&gt;&lt;a href="#%e7%aa%81%e7%a0%b4%e4%ba%8c%e8%b6%85%e8%8a%82%e7%82%b9%e6%96%b9%e6%a1%88%e5%a6%82%e4%bd%95%e5%bc%a5%e8%a1%a5%e5%8d%95%e5%8d%a1%e5%b7%ae%e8%b7%9d" class="header-anchor"&gt;&lt;/a&gt;突破二：超节点方案如何弥补单卡差距
&lt;/h2&gt;&lt;p&gt;坦白讲，单论单卡算力，昇腾目前还难以直接与英伟达最先进的芯片竞争。&lt;/p&gt;
&lt;p&gt;受限于先进制程的获取，这是客观现实。&lt;/p&gt;
&lt;p&gt;但华为选择了一条不同的技术路径——&amp;ldquo;超节点 + 集群&amp;rdquo;。&lt;/p&gt;
&lt;p&gt;什么意思？&lt;/p&gt;
&lt;p&gt;在摩尔定律放缓的情况下，从 7 纳米到 3 纳米，每代性能提升不超过 20%。但超节点可以将模型算力利用率从 30% 提升到 45%，相当于提升了 50%。&lt;/p&gt;
&lt;p&gt;通过资源的高效调度，在一定程度上可以弥补芯片工艺代差。&lt;/p&gt;
&lt;p&gt;徐直军有句话很直白：&amp;ldquo;由于美国制裁，我们不能产出最先进工艺制程的芯片，但我们基于过去三十多年构筑的联接技术能力，使得我们能够做到万卡级的超节点，经营万卡级的超节点，做到在世界上算力最强。&amp;rdquo;&lt;/p&gt;
&lt;p&gt;昇腾 950 超节点是什么规模？&lt;/p&gt;
&lt;p&gt;8192 张加速卡，128 个计算机柜和 32 个互联机柜，整套系统共计 160 个机柜。&lt;/p&gt;
&lt;p&gt;相较于英伟达同样将在下半年上市的 NVL144，Atlas 950 超节点的规模是其 56.8 倍，总算力是其 6.7 倍，内存容量是其 15 倍。&lt;/p&gt;
&lt;p&gt;当然，集群也面临能耗、占地大等问题。这是技术选择，不是技术碾压。&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;当单点突破不够快时，系统就是答案。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;DeepSeek-V4 属于典型的 MoE 模型，总参数规模达 1.6 万亿、激活参数 49B，这对推理集群的规模和效率提出了极高要求。&lt;/p&gt;
&lt;p&gt;8192 卡的超节点，尤其适合这种架构。&lt;/p&gt;
&lt;p&gt;&lt;img alt="超节点数据中心" class="gallery-image" data-flex-basis="426px" data-flex-grow="177" height="1440" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://i.ibb.co/qYY9pSf1/e1a1b4d03dcf.jpg" srcset="https://www.gpt-hub.top/e1a1b4d03dcf_2209893804519993321_hu_7a414f43df7ecc31.jpg 800w, https://www.gpt-hub.top/e1a1b4d03dcf_2209893804519993321_hu_bb658a304306dbd0.jpg 1600w, https://www.gpt-hub.top/e1a1b4d03dcf_2209893804519993321_hu_d8af15dc69a8bcbb.jpg 2400w, https://i.ibb.co/qYY9pSf1/e1a1b4d03dcf.jpg 2560w" width="2560"&gt;&lt;/p&gt;
&lt;h2 id="突破三价格下降通道已经打开"&gt;&lt;a href="#%e7%aa%81%e7%a0%b4%e4%b8%89%e4%bb%b7%e6%a0%bc%e4%b8%8b%e9%99%8d%e9%80%9a%e9%81%93%e5%b7%b2%e7%bb%8f%e6%89%93%e5%bc%80" class="header-anchor"&gt;&lt;/a&gt;突破三：价格下降通道已经打开
&lt;/h2&gt;&lt;p&gt;如果说昇腾 950 解决的是&amp;quot;能不能跑&amp;quot;，那么 Atlas 950 SuperPoD 解决的则是&amp;quot;能不能跑得更便宜、更大规模&amp;quot;。&lt;/p&gt;
&lt;p&gt;看价格。&lt;/p&gt;
&lt;p&gt;DeepSeek V4-Pro 每百万 Tokens 输入是 1 元，输出是 12 元；V4-Flash 每百万 Tokens 输入是 0.2 元，输出是 2 元。&lt;/p&gt;
&lt;p&gt;同时，DeepSeek 明确表示：&amp;ldquo;预计下半年昇腾 950 超节点批量上市并部署之后，Pro 版本的价格也会大幅度下调。&amp;rdquo;&lt;/p&gt;
&lt;p&gt;为什么敢这么说？&lt;/p&gt;
&lt;p&gt;高并发推理的关键不在单卡峰值算力，而在单位时间能服务多少请求、生成多少 Tokens。&lt;/p&gt;
&lt;p&gt;吞吐提升后，API 价格便有了下调空间。&lt;/p&gt;
&lt;p&gt;一旦昇腾 950 超节点批量上市，理论上将带来三重变化：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;吞吐能力显著提升&lt;/strong&gt;。高并发推理场景下，单位时间生成的 Tokens 数量决定成本。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;单位 Token 成本下降&lt;/strong&gt;。API 价格有了下调空间，Pro 版本可以走向大规模商业化。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;国产算力供给规模化&lt;/strong&gt;。AI 推理不一定只能依靠最贵的 GPU，国产算力同样可以开辟一条新路。&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;技术的终点是商业，国产算力的商业化拐点到了。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;这里有个清晰的国产算力替代逻辑：&lt;/p&gt;
&lt;p&gt;如果 DeepSeek 能够在昇腾上跑出不输英伟达的推理性能，且成本更低，那么它将向整个行业证明——国产芯片已具备承载实际商业负载的能力。&lt;/p&gt;
&lt;p&gt;这不是&amp;quot;备胎&amp;quot;，这是&amp;quot;正选&amp;quot;之一。&lt;/p&gt;
&lt;p&gt;&lt;img alt="价格下降趋势" class="gallery-image" data-flex-basis="426px" data-flex-grow="177" height="1440" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://i.ibb.co/bg2Y34qF/6781b8954de2.jpg" srcset="https://www.gpt-hub.top/6781b8954de2_11025525683381749763_hu_e1fd77f97508237a.jpg 800w, https://www.gpt-hub.top/6781b8954de2_11025525683381749763_hu_19879577a5dd4037.jpg 1600w, https://www.gpt-hub.top/6781b8954de2_11025525683381749763_hu_7ff7f3edb1286a67.jpg 2400w, https://i.ibb.co/bg2Y34qF/6781b8954de2.jpg 2560w" width="2560"&gt;&lt;/p&gt;
&lt;h2 id="产业链已经起飞谁在受益"&gt;&lt;a href="#%e4%ba%a7%e4%b8%9a%e9%93%be%e5%b7%b2%e7%bb%8f%e8%b5%b7%e9%a3%9e%e8%b0%81%e5%9c%a8%e5%8f%97%e7%9b%8a" class="header-anchor"&gt;&lt;/a&gt;产业链已经起飞：谁在受益
&lt;/h2&gt;&lt;p&gt;DeepSeek-V4 适配昇腾的消息，让国产算力产业链彻底站上了聚光灯下。&lt;/p&gt;
&lt;p&gt;一颗昇腾芯片背后，是一条从服务器整机到覆铜板的庞大链条。&lt;/p&gt;
&lt;p&gt;在这个链条上，最核心的环节是什么？&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;服务器整机制造&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;AI 芯片必须被物理集成到服务器中，才能进入算力中心、云厂商和政企客户。这一环节也最快转化为订单和营收。&lt;/p&gt;
&lt;p&gt;根据中商产业研究院分析师预测，2026 年市场规模将达到 2859 亿元。&lt;/p&gt;
&lt;p&gt;昇腾产业链分为三层：&lt;/p&gt;
&lt;p&gt;最内层是服务器整机制造商，获单最为直接。华鲲振宇是华为生态中唯一同时获得&amp;quot;鲲鹏 + 昇腾&amp;quot;双领先级认证的企业，其&amp;quot;天宫&amp;quot;系列 AI 服务器已量产并进入多个省级智算中心。&lt;/p&gt;
&lt;p&gt;A 股上市公司中，神州数码旗下神州鲲泰、拓维信息都是华为昇腾生态的重要整机硬件伙伴。&lt;/p&gt;
&lt;p&gt;中间层是由 CANN 架构为核心的软件生态，决定厂商的生态黏性。&lt;/p&gt;
&lt;p&gt;一个重要的信号来自运营商层面：中国移动 2026 年—2027 年人工智能超节点设备集采已开标，采购规模 6208 张 AI 加速卡，总金额约 20.6 亿元，中标文件明确全线采用华为 CANN 生态方案。&lt;/p&gt;
&lt;p&gt;这是三大运营商在集团层面首次启动 AI 超节点设备集采，标志着运营商级基础设施正在加速接入国产 CANN 生态。&lt;/p&gt;
&lt;p&gt;最外层是上游材料和元件供应商，包括覆铜板、交换机、高速铜连接模组等。&lt;/p&gt;
&lt;p&gt;华丰科技是华为高速背板连接器的核心供应商，作为第一大客户，去年贡献了超 60% 的收入。&lt;/p&gt;
&lt;p&gt;华泰证券研报判断 2026 年为&amp;quot;国产超节点元年&amp;quot;，测算到 2028 年国产超节点市场空间有望达到 3414 亿元，2026 年至 2028 年的年复合增长率高达 194%。&lt;/p&gt;
&lt;p&gt;&lt;img alt="昇腾产业链结构" class="gallery-image" data-flex-basis="426px" data-flex-grow="177" height="1440" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://i.ibb.co/Y7XvPxdx/ac73d257aa9e.jpg" srcset="https://www.gpt-hub.top/ac73d257aa9e_5466150073642587450_hu_51376e27b542f31f.jpg 800w, https://www.gpt-hub.top/ac73d257aa9e_5466150073642587450_hu_b89de196deca70e.jpg 1600w, https://www.gpt-hub.top/ac73d257aa9e_5466150073642587450_hu_fb3e3e60ba1c8fb1.jpg 2400w, https://i.ibb.co/Y7XvPxdx/ac73d257aa9e.jpg 2560w" width="2560"&gt;&lt;/p&gt;
&lt;h2 id="写在最后"&gt;&lt;a href="#%e5%86%99%e5%9c%a8%e6%9c%80%e5%90%8e" class="header-anchor"&gt;&lt;/a&gt;写在最后
&lt;/h2&gt;&lt;p&gt;DeepSeek-V4 适配昇腾，这件事的意义不在当下，在未来。&lt;/p&gt;
&lt;p&gt;它证明了一个可能性——AI 推理不一定只能依靠最贵的 GPU，国产算力同样可以开辟一条新路。&lt;/p&gt;
&lt;p&gt;当然，产业链机遇的背后也有变数。&lt;/p&gt;
&lt;p&gt;昇腾芯片的产能能否跟上爆发式需求，将直接决定整条产业链的订单能否如期兑现。&lt;/p&gt;
&lt;p&gt;但这场由 DeepSeek 与昇腾共同点燃的算力变革，才刚刚拉开序幕。&lt;/p&gt;
&lt;p&gt;下半年，昇腾 950 超节点批量上市后，Pro 版本的价格会不会真的大幅下调？&lt;/p&gt;
&lt;p&gt;这个问题，值得持续关注。&lt;/p&gt;</description></item></channel></rss>