
自DeepSeek推出以来,其配套硬件产品——DeepSeek一体机备受市场关注。DeepSeek大模型的应用和部署需要强大的计算设备支持,根据不同的模型参数版本(如DeepSeek-R1已发布的1.5B、7B、8B、14B、32B、70B、671B等),用户可选择不同规格的硬件配置以满足需求。
多家国产芯片厂商支持DeepSeek大模型
自今年2月起,多家国产芯片厂商宣布完成对DeepSeek模型的适配,包括华为昇腾、沐曦、昆仑芯、壁仞科技、海光、天数智芯、燧原科技、摩尔线程等。部分厂商的硬件已广泛应用于DeepSeek一体机中。例如,联想联合沐曦推出了基于DeepSeek大模型的国产一体机解决方案。发布仅一个月,该方案累计出货量突破千台,配备了近万张沐曦国产GPU卡,覆盖医疗、教育、制造等十多个核心行业。
以下是部分国产芯片厂商与DeepSeek适配的进展:
1. 昇腾910
华为昇腾910 AI芯片凭借其PFLOPS FP16超高算力,已全面支持DeepSeek全量版本适配。例如,基于昇腾910的软通动力旗舰版A800I A2服务器,采用鲲鹏920处理器,支持8模组高效推理和高速NPU互联技术,成为DeepSeek模型运行的优质选择。此外,华为计划今年量产最新的昇腾910C芯片,其性能据称可达到Nvidia H100 GPU的60%。
2. 沐曦曦思N260与曦云C500
联想联合沐曦推出的DeepSeek大模型一体机,分别面向推理和训推场景,搭载曦思N260和曦云C500国产GPU。曦思N260支持本地部署DeepSeek蒸馏模型推理,实测性能达到国际主流GPU的110%-130%。曦云C500则为大模型训练和推理提供强大算力支撑。
3. 海光DCU
海光DCU(深度计算单元)是海光信息推出的高性能GPGPU架构AI加速卡,已完成DeepSeek R1/V3模型的适配。凭借卓越的算力性能和完备的软件生态,DCU已在教育、医疗、政务等多个领域实现规模化应用。
4. 昆仑芯P800
昆仑芯P800采用XPU-R架构,融合通用计算单元和专用AI加速单元,支持DeepSeek R1/V3全系列模型的本地化部署。其高并发性能使得一台8卡服务器即可完成大规模推理任务。
5. 壁仞科技壁砺系列
壁仞科技的壁砺TM系列产品支持从1.5B到70B参数规模的DeepSeek蒸馏模型,提供高性能、低成本的大模型部署解决方案。壁仞科技已与多家企业合作,将DeepSeek模型应用于生产实践中。
6. 天数智芯
天数智芯的BI-V150芯片完成了DeepSeek R1千问蒸馏模型的适配,为开发者提供了更多灵活选择算力的机会。
7. 摩尔线程KUAE集群
摩尔线程完成了DeepSeek蒸馏模型的部署,KUAE智算中心成为国内首个以国产全功能GPU为底座的大规模算力集群。
8. 燧原科技S60
燧原科技第三代推理卡S60在太湖亿芯智算中心完成DeepSeek全量模型的部署,展现出强大的计算能力和稳定性。
9. 申威AI加速卡
申威威鑫H8000处理器与DeepSeek模型的深度兼容性,使得申威一体机可在本地实现大模型的高效运行,适配多个行业场景。
10. 云天励飞DeepEdge10
云天励飞DeepEdge10系列芯片支持多种主流模型架构,已成功适配DeepSeek R1系列模型,为智慧城市、智能制造等场景提供算力支持。
11. 景嘉微JM系列与景宏系列
景嘉微的JM系列和景宏系列完成了DeepSeek R1全系列模型的适配,结合高效的vLLM推理框架,为开发者提供经济高效的解决方案。
12. 太初元碁T100加速卡
龙芯中科联合太初元碁推出的T100加速卡,已完成DeepSeek R1系列模型的适配,进一步推动本地化部署的便捷性。
DeepSeek R2发布在即
据业内人士透露,DeepSeek R2人工智能模型预计将在今年发布。新模型将进一步优化推理效率,降低算力需求,同时扩展多语言能力。这一进展或将为国产AI芯片带来更多机会,推动AI技术的普及与应用。
市场前景与挑战
根据浙商证券测算,DeepSeek一体机的需求量将在未来几年快速增长,2025年至2027年的市场空间预计分别达到1236亿元、2937亿元和5208亿元。然而,当前一体机的软硬件协同仍面临挑战,例如FP8精度支持不足和算力效率优化问题。未来,随着技术的不断突破,DeepSeek一体机市场有望迎来更广阔的发展空间。