首页>商情资讯>行业新闻

突发!英伟达H20芯片在华订单大增

2025-2-27 9:20:00
  • 英伟达

突发!英伟达H20芯片在华订单大增

中国企业大规模采购英伟达 H20 芯片,DeepSeek 部署热潮推高需求

据多位知情人士透露,由于低成本人工智能模型 DeepSeek 的需求激增,中国多家企业近期显著增加了对英伟达 H20 人工智能芯片的订单。这一趋势或将缓解此前市场对 DeepSeek 可能导致 AI 芯片需求下滑的担忧。

在此之前,DeepSeek 的爆发性增长曾一度对英伟达产生冲击。今年 1 月,DeepSeek 发布了 R1 模型的开源版本,凭借其低成本训练的优势迅速引发行业关注。消息公布当天,英伟达股价大幅下跌 16.9%,市值在三天内蒸发约 6000 亿美元。DeepSeek 展现出的颠覆性成本优势成为市场反应如此剧烈的重要原因。据悉,DeepSeek 仅使用约 2000 个芯片集群,耗资约 560 万美元便完成了高性能 V3 模型的训练。这一成本远低于其他国际大模型的训练费用,为行业提供了低成本开发大模型的全新思路。

然而,英伟达 CEO 黄仁勋曾表示,市场对 DeepSeek 的影响存在误解。尽管 DeepSeek 确实在预训练阶段展现了成本效率,但后续的微调训练以及推理部署仍然需要大量计算资源。此外,DeepSeek 模型的实际落地应用同样离不开高性能芯片的支持。随着 AI 技术加速普及,英伟达仍然是这一领域的主要受益者。

DeepSeek 部署热潮推动算力需求

DeepSeek 的开源消息曾引发投资者担忧,主要集中在其“低成本逻辑”可能终结大模型领域的扩展规律(Scaling Law)。这一规律指的是,在自然语言处理(NLP)和多模态模型中,随着模型规模、数据量和计算资源的增加,模型性能呈幂律关系提升。

Scaling Law 主要体现在两种扩展方式:横向扩展(Scale Out)和纵向扩展(Scale Up)。前者通过分布式集群实现高并发处理能力,后者则依赖性能更强的单节点硬件。DeepSeek 的低成本优势被认为可能削弱对 Scale Out 的需求。然而,事实证明,这种担忧是多余的。

随着 DeepSeek 模型的广泛部署,算法效率的提升并未减少算力需求,反而因更多用户和场景的加入,加速了 AI 模型的普及与落地。这一趋势推动了数据中心、边缘计算和终端设备的算力建设需求。为了满足不断增长的计算需求,企业仍需通过 Scale Out 扩展计算能力。换言之,大规模部署 DeepSeek 模型进行训练和推理任务,对高性能计算芯片的需求依然巨大。

业内人士指出,DeepSeek 模型的服务器性能瓶颈主要集中在 GPU 推理资源上。如果 GPU 资源不足,应用服务可能出现宕机,严重影响用户体验。

腾讯、阿里巴巴和字节跳动成英伟达 H20 的主要买家

据知情人士透露,自 DeepSeek 上个月进入全球公众视野以来,腾讯、阿里巴巴和字节跳动等企业对英伟达 H20 芯片的订单显著增加。腾讯和阿里巴巴已全面拥抱 DeepSeek 模型,而字节跳动则希望通过技术创新再次超越 DeepSeek。

腾讯方面,其旗下多个产品已接入 DeepSeek 模型,包括腾讯元宝、腾讯文档、QQ 浏览器、微信搜索以及《和平精英》等。数据显示,自 2 月 13 日腾讯元宝接入 DeepSeek-R1 模型以来,该产品在一周内完成四次重大功能更新,新增了图片理解、深度思考等能力。同时,通过微信搜索引流,元宝的安卓单日新增下载量达到 160 万,iOS 应用排名也从 200 名开外跃升至第二。

阿里巴巴方面,1688 和 DataWorks 等核心平台也已接入 DeepSeek。作为阿里云大数据生态的核心产品,DataWorks 支持多种大数据引擎和 AI 计算服务,能够适配数据湖、数据仓库以及湖仓一体解决方案。值得一提的是,DeepSeek 的技术发展也受益于阿里巴巴此前对开源大模型的技术贡献。

至于字节跳动,该公司则在探索如何超越 DeepSeek 再次引领国产 AI 大模型的发展。此前,字节跳动 CEO 梁汝波表示,公司意识到去年 AI 技术发生了重大变化,但并未急于在模型研发上争先。他认为,重要的是解决关键技术问题,而非追求时间上的领先。

无论是全面拥抱 DeepSeek 还是寻求技术超越,从当前 AI 大模型的发展趋势来看,部署大规模计算芯片以提供优质推理服务已成为行业共识,而英伟达 H20 芯片正是企业的首选之一。

H20 芯片的技术优势与市场前景

英伟达 H20 是专为中国市场设计的人工智能芯片,旨在满足美国出口管制政策的要求,成为 H100 等高端产品的替代方案。H20 基于英伟达 Hopper 架构,采用先进的 CoWoS 封装技术,其 FP8 算力达 296TFLOPS,FP16 算力为 148TFLOPS,配备 96GB HBM3 显存,显存带宽高达 4.0TB/s,功耗为 400W。此外,H20 支持 PCIe Gen5 x16 和 NVLink 900GB/s 高速互联,提供了卓越的数据传输性能。

数据显示,2024 年英伟达共出货约 100 万颗 H20 芯片。随着 DeepSeek 部署热潮的持续升温,预计 2025 年 H20 芯片的销量将进一步增长,为英伟达带来可观的收入。