nh1

沐曦股份曦云C系列:实现优异线性扩展,为云端智算发展注入新动能

栏目:行业   作者:张仪    发布时间:2025-10-19 13:49   阅读量:7219   会员投稿

10月17日晚,上交所上市审核委员会10月17日公告,定于2025年10月24日召开2025年第46次上市审核委员会审议会议,审议沐曦集成电路(上海)股份有限公司首发事项。

作为国内少数几家系统掌握了高性能GPU芯片及其基础系统软件研发、设计和量产技术的企业之一,沐曦集成电路(上海)股份有限公司(以下简称:沐曦股份)在云端计算领域的核心产品——曦云C系列,凭借卓越性能,成为人工智能训练与推理、通用计算的核心算力支撑。该系列具备高性能、高自主可控、高扩展性三大核心优势,为各类复杂计算任务提供坚实底座。

据了解,沐曦股份于2023年推出首款训推一体GPU芯片曦云 C500,随后迭代推出曦云C550,同时推进基于国产供应链的曦云C600(在研)研发,三款产品各有侧重:

曦云C500:采用自研 XCORE 1.0 架构及指令集,配备标量、矢量和张量计算单元,支持多种混合精度计算,搭载64GB HBM2e显存与7个高速 MetaXLink 互连接口,可实现2卡至64卡多种互连拓扑,具备国内稀缺的高带宽、超多卡互连能力;依托自研MXMACA软件栈,适配主流算法框架、运算库等工具,编程接口在API层面高度兼容GPU行业国际主流CUDA 生态。

曦云C550:同样基于XCORE 1.0架构及指令集,面向云端 AI 训练与推理、通用计算、AI for Science 等任务,拥有丰富计算单元且算力密度更高,支持多种混合精度计算,配备 64GB HBM2e 显存与卡间高速互连功能。

曦云C600(在研):立足国产供应链,采用 XCORE 1.5 架构及指令集,新增 FP8 Tensor 及 Tensor 转置指令,具备多元计算单元,支持多种混合精度计算,搭载 HBM3e 显存与卡间高速互连,进一步优化性能与适配性。

从硬件配置来看,曦云C系列GPU芯片结构逻辑复杂,集成运算单元、高速缓存、控制单元等多元组件,接口丰富且协议支持全面,不仅兼容 PCIe、CXL 等通用协议,还搭载自主研发的 MetaXLink 协议,能灵活适配不同应用场景需求。其强大的多精度混合算力、高带宽与大容量存储,结合 MetaXLink 高速互连技术,可轻松满足大规模计算集群扩展需求,支持千亿参数以上AI大模型训练,有效提升集群算力,显著缩短大模型计算时间。

目前,沐曦股份已量产的训推一体 GPU 芯片凭借强大的大规模并行计算能力,与新华三等服务器整机厂深度合作,在多个智算中心实现规模化应用。面对大模型迭代带来的大规模集群算力增长需求,依托领先的MetaXLink互连技术,曦云 C 系列可在大规模集群中实现优异线性扩展,未来将在智算集群实际运营中持续释放强劲性能,为云端智算发展注入新动能。

ad