导语经营火锅店20年的芳姐,做生意向来精
6月24日,行云科技(300209.SZ)举行首席科学家聘任仪式。行云集团创始人、董事长王维向南方科技大学研究员、AlayaDB.AI创始人唐博颁发聘书,后者正式就任行云科技首席科学家,全权负责公司AI算力业务技术规划、核心技术落地、算力性能优化及研发团队技术管理工作。
深耕系统软件 兼具学术与产业技术积累
AI算力产业由硬件规模竞争转向系统效率竞争关键阶段的当下,唐博的加盟被认为行云科技在大模型系统架构领域的核心技术短板被补齐。唐博在其主题演讲中以“AI时代=算力基建×Token 效率”公式,提出算力资源与系统推理效率为乘数协同关系,依靠系统层面重构释放算力价值等前沿观点。
公开资料显示,唐博为香港理工大学博士,长期研究大模型推理系统、人工智能底层系统软件。学术领域,唐博2024年获批国家自然科学基金优秀青年项目,先后入选 CCF 青年人才计划、斩获 ACM SIGMOD 中国新星奖、三次华为火花奖,带队拿下三项CCF-A类顶会竞赛全球冠军;自2017年起任职南方科技大学计算机系,担任研究员、博士生导师。
产业端,唐博2025年创办AlayaDB.AI,主攻超长上下文大模型推理方案。团队研发的Attention与KV Cache一体化卸载架构,针对性解决大模型推理延迟高、算力损耗大、长文本输出失真等行业共性难题,相关技术可支撑AI Agent 大规模商业化落地。
全新推理引擎发布 算力利用率显著提升
聘任仪式上,行云科技同步对外推出AlayaJet推理引擎。据唐博介绍,引擎搭载O(1)显存Prefill、CPU-GPU协同解码等自研技术,在同等硬件条件下,对比主流开源引擎vLLM,推理吞吐量提升 44%,首字输出延迟降低28%。
行业传统模式中,企业单独采购GPU硬件部署大模型,硬件资源与模型推理相互割裂,算力利用率偏低,单位Token使用成本居高不下。AlayaJet 依靠底层系统优化,无需更新硬件即可压缩推理成本,成为行云科技推进 MaaS 业务转型的核心技术底座。
依托该引擎,行云科技推出行云Token云(TaaS)服务,完成业务模式迭代:对外交付产品从GPU算力实例转为标准化模型API,收费模式由按硬件使用时长计费,调整为依据Token数量与业务实际效果结算。公司业务定位也从算力硬件服务商,转向标准化AI智能服务交付平台。唐博表示,MaaS 并非传统算力服务的简单升级,而是产业链价值分配的范式迁移,有望持续拉高企业盈利空间。
行业竞争逻辑转变,系统架构能力成算力企业核心壁垒
行云科技在AI算力全产业链布局动作频频,涵盖业务覆盖硬件配套、算力调度、MaaS平台搭建等,近期陆续拿下数亿元服务器、存储设备采购订单,算力基础设施储备充足。
当前AI算力上游硬件供给逐步充足,硬件采购成本红利持续收窄,行业竞争重心转移至算力调度、推理优化等软件系统能力。对于中游算力运营企业而言,底层系统架构技术,直接决定单位智能产出成本与服务稳定性。
业内分析认为,唐博及其技术团队的加入,有助于行云科技形成硬件算力规模、底层推理效率双向协同的发展路径,与仅提供硬件租赁的同行形成差异化竞争优势。从资本市场视角来看,市场对行云科技的价值判断逻辑也随之调整,算力硬件保有量不再是核心评估标准,算力向智能服务的转化效率将成为衡量企业长期价值的关键指标,契合AI基础设施行业从“搭建硬件”到“高效运营算力” 的整体发展趋势。
导语经营火锅店20年的芳姐,做生意向来精
孩子眯眼看黑板?98%的验光误差藏在这3
当人工智能成为金融行业转型核心引擎,当数
5月底,《凡人修仙传》与清洁暖科技品牌友
近日,南京市“五载聚力·宁惠小微”中小微
2026年6月,拥有65年历史的全球知名
2026年6月29日,上海–近日,迅达中
2026年6月27日,查博士在北京成功举
2026年6月,美国EB-5投资移民新政
