华为欲破HBM依赖困局,美国管制松绑预期升温
据悉,华为有望在8月12日举办的“2025金融AI推理应用落地与发展论坛”上,发布AI推理领域的突破性技术成果,从而降低中国AI推理对HBM(高带宽内存)技术的依赖,提升国内AI大模型推理性能,完善中国AI推理生态的关键部分。
华为数据存储产品线副总裁樊杰在接受央广财经记者专访时指出,AI下一阶段的突破将高度依赖高质量行业数据的释放,而存力正是激活数据价值、赋能垂直行业的关键基础设施。华为通过技术优化,推出的高性能AI存储,能够将小时级数据加载缩短至分钟级,使算力集群效率从30%提升至60%。在推理环节,通过长记忆存储能力,避免重复运算,大幅降低推理成本。
业内人士表示,当前AI产业已从“追求模型能力的极限”转向“追求应用价值的最大化”,推理成为AI下一阶段的发展重心。而作为一种高性能的3D堆叠DRAM技术,HBM是解决“数据搬运”的关键,被广泛应用于AI推理和训练场景。当其不足时,用户使用AI推理的体验会明显下降,导致出现任务卡顿、响应慢等问题。但目前,HBM成本较高且供应受限,如果能通过减少对HBM的依赖,降低AI推理系统的成本,提高系统的可扩展性和经济性,那么将使更多企业负担得起高性能的AI推理解决方案。
华为在AI推理领域已有一定技术积累。2025年3月,北京大学联合华为发布了DeepSeek全栈开源推理方案,该方案基于北大自研SCOW算力平台系统和鹤思调度系统,整合了DeepSeek、openEuler、MindSpore与vLLM/RAY等社区开源组件,实现了华为昇腾上的DeepSeek高效推理。同时,华为昇腾在性能方面也有多项突破,如 CloudMatrix 384超节点部署DeepSeek V3/R1 时,在50ms时延约束下单卡Decode 吞吐突破1920Tokens/s等。
全球HBM市场格局
目前,全球HBM市场集中度极高,韩国SK海力士、三星电子与美国美光科技占据近95%的市场份额,形成寡头垄断格局。其中,SK 海力士凭借与英伟达的深度合作稳居第一,2025年一季度市占率高达70%,其HBM3E产品包揽英伟达H100/H200 GPU 80%-90%的供应,对英伟达的销售额占其HBM总收入的 75%。三星电子以 30%-38%的份额紧随其后,重点供应AMD、博通等客户,2025年计划将HBM供应量扩大至去年两倍,并加速推进HBM4量产。美光科技则实现快速崛起,市占率从 2023年的10%提升至2025年的20%,其HBM3E产品通过性价比优势向亚马逊、微软等ASIC客户拓展。
中国厂商虽在HBM2领域实现突破,但尚未进入国际主流供应链,市场份额不足5%,主要应用于国内 AI 服务器测试场景,与国际领先水平仍有1-2代的差距。
从技术角度来看,HBM3E仍是市场主流,SK海力士12层堆叠产品带宽达1.2TB/s,功耗降低20%;三星8层HBM3E已通过博通认证,计划向AMD MI400X供货;美光则主打性价比,覆盖中小客户需求。HBM4的开发竞赛也已全面展开:SK海力士样品带宽达1.6TB/s,预计2026年配套英伟达Rubin GPU量产;三星采用 4nm逻辑芯片+10nm DRAM工艺,目标带宽4.8TB/s,计划2025年底量产;美光已向客户送样12层堆叠36GB HBM4,带宽超2.0TB/s,性能较上一代提升60%。
与此同时,全球 HBM 供应链呈现显著的“客户绑定”特征。SK海力士与英伟达形成深度依存关系,为保障对英伟达的供应,其向韩华半导体采购14台TC键合机,并计划全年订购80台设备;三星则拓展多元客户,除AMD外,开始向AWS、Meta等云计算厂商供货,并为谷歌TPU v6提供定制化方案;美光重点布局ASIC市场,亚马逊 Trainium、微软MTT等平台均采用其HBM产品,2025年上半年ASIC相关收入占比达30%。
从产能看,2025年全球HBM月产能约18万片晶圆,而AI服务器需求达10万片/月,供需处于紧平衡状态。高盛预测,2026年全球HBM月产能将达30万片,远超16.8万片的需求预测,可能导致价格下跌10%-15%,市场将从“产能争夺”转向“性价比竞争”。
美国对中国HBM出口管制会松绑吗?
近期,有关美国对中国HBM出口管制政策走向的讨论持续升温。
《金融时报》报道指出,中国官方已向华盛顿方面的政策专家明确传达,放宽对HBM芯片的出口限制是中方的重点诉求。有消息人士称,中方此举意在推动美国在AI芯片相关出口限制上做出更多实质性让步,HBM作为AI芯片的关键组件,其出口管制的松动对中国AI产业发展意义重大。
早在2022年9月,美国政府首次管制英伟达人工智能芯片对华出口,此后相关限制措施不断升级,严重阻碍了中国企业在AI领域的技术发展进程。而在2025年6月,中美经贸谈判迎来关键进展,双方代表团在伦敦举行的经贸磋商机制首次会议上达成了“伦敦框架”。7月15日,英伟达宣布美国政府放开对AI芯片H20的出口限制,美国商务部部长霍华德・卢特尼克次日证实,恢复H20对华出口是美国和中国稀土谈判的一部分。这一系列事件让业界开始重新审视美国对华芯片出口管制政策的走向,HBM出口管制的松绑预期也随之浮现。
从美国国内产业利益角度来看,半导体行业巨头们对放宽出口管制的呼声日益高涨。以英伟达为例,中国市场在其全球营收中占比颇高,此前出口管制措施导致英伟达库存积压严重,经济损失巨大。黄仁勋曾多次公开表达对出口管制的不满,称其“助推华为崛起”,并展开密集游说活动。同样,AMD官方也向媒体透露,收到特朗普政府通知,向中国出口MI308产品的许可证申请将进入审核流程,计划在获批后恢复出货。美国芯片企业对中国市场的强烈需求,成为推动政府重新考量HBM出口管制政策的重要内部动力。
另外,有分析认为,美国政府在评估对华芯片出口管制政策时,开始考虑中国本土AI芯片技术的发展现状。若中国已具备与美国出口芯片等效的替代品,那么过度管制可能导致美国芯片企业失去中国这一庞大市场,反而促使全球客户转向中国或其他国家的芯片供应商。财政部部长贝森特接受采访时曾提及,对中国本土竞争能力的评估是决策的关键因素之一。这种基于市场和竞争层面的考量,或为HBM出口管制松绑创造一定空间。
不过,美国国内也存在反对放松出口管制的声音。部分安全专家和前官员认为,放宽对中国的芯片出口限制,尤其是HBM这类对AI发展至关重要的芯片组件,将危及美国在人工智能领域的经济和军事优势。20名安全专家和前官员计划致信美国商务部部长表达此类担忧,认为这一举措是战略性失误。这表明,美国国内在对华芯片出口管制政策上存在分歧,未来HBM出口管制政策走向仍充满不确定性。