nh1

国际权威认可!联想万全异构智算研发团队斩获 IEEE CSCWD’26最佳会议论文奖

栏目:行业   作者:公孙衍    发布时间:2026-06-12 10:03   阅读量:11653   会员投稿

近日,第29届IEEE计算机支持协同设计国际会议(IEEE CSCWD 2026)在福州圆满落幕。联想万全异构智算研发团队的论文《Adaptive Parallelism for LLM Inference with Model Irrelevant Profiler》,被IEEE CSCWD 2026大会成功接收,并斩获最佳会议论文奖(Best Conference Paper Award),成为本次大会仅有的2篇最佳论文之一。

IEEE是全球最大的专业技术组织,其中CSCWD作为IEEE每年举办的协同设计与协同计算领域的权威会议,聚焦于软硬件协同优化、协同设计等领域的前沿成果,其论文将收录于IEEE Xplore与EI数据库。本届 CSCWD 2026 共录用论文700余篇,经过严格初选与会议现场答辩,最终仅2篇论文摘得最佳会议论文奖,联想万全异构智算研发团队成果位列其中,实现技术创新与学术价值的双重突破。

此次联想获奖论文中创新性的提出了一种面向大模型推理的并行优化算法,直击软硬件协同并行策略适配复杂、人工调整参数成本高的行业痛点,实现软硬协同推理性能的跨越式升级,再度印证联想在模型推理方面的全球顶尖技术实力。

随着大模型规模化落地,推理并行策略的优化成为提升算力效率的关键,但行业长期面临核心难题:一是大模型推理最优并行策略高度依赖模型结构与GPU硬件算力,二者联合调优难度极大;二是传统调优方案依赖特定模型与硬件的在线参数搜索,存在参数调优周期长、仅适配单一模型、现场交付成本高等短板。

尤其在大模型私有化交付场景,调优工程师需驻场针对客户硬件与模型逐一调试,耗时长达小时级,人力成本高企;更换模型后更需重复调优,严重制约大模型私有化部署的效率与规模化推广。

针对上述痛点,联想万全异构智算研发团队面向大模型推理的自适应并行优化算法,创新性提出一种两阶段大模型推理并行策略自动调优方法,彻底重构调优逻辑:

第一阶段是在预评测阶段,针对典型的GPU卡,对不同规格的Transformers算子进行并行开销预评测,完成与模型无关的前置算力建模;

第二阶段是在模型部署阶段,针对待部署模型的Transformers算子规格,依据预评测结果进行计算模式匹配,预测模型的最优并行策略。

该算法解耦了调优评测和并行预测,模型无关的预评测不需要在客户现场进行,使现场调优时间从小时级压缩至秒级,从根源降低了模型调优服务的交付成本,完美适配私有化部署场景需求。

实测场景中,团队选择在20余款当前主流大模型上完成全场景严苛评测,核心指标表现突出:并行策略预测Top-1 准确率达88%;模型吞吐性能最大提升34%;算法可无缝适配vLLM、SGLang等主流大模型推理框架,通用性与实用性拉满。

本次获奖论文中的创新技术与联想万全异构智算平台高度契合,直接面向大模型私有化部署调优核心场景。算法落地后,可显著缩短万全平台大模型推理服务的交付周期、削减人力投入,进一步强化平台在 AI 异构计算领域的技术壁垒,为教育科研、工业制造、云计算、大数据等行业的私有化智算场景,提供高效、低成本的一站式优化方案。

未来,联想万全异构智算研发团队将持续迭代大模型推理并行优化算法,拓展多节点、MoE大模型等复杂场景的适配能力,推动技术深度融入万全异构智算平台,持续打磨大模型训推全流程优化能力。

此次斩获IEEE CSCWD 2026最佳会议论文奖,不仅是联想万全异构智算研发团队科研创新与技术攻坚的实力彰显,更是国际学术界对联想在大模型推理优化前沿领域技术突破的权威认可。在大模型私有化部署加速普及、智能算力迈向规模化普惠的关键时期,联想中国基础设施业务将始终坚守“一横四纵”战略布局,以技术创新为核心驱动,持续夯实软硬件协同优化、大模型高效训推等底层能力,加速大模型高效部署与算力普惠,为全球人工智能与数字经济高质量发展注入持久的联想力量。

ad