nh1

效果、性能双突破!快手OneSug端到端生成式框架入选AAAI 2026

栏目:行业   作者:冯亭    发布时间:2026-01-20 14:31   阅读量:9570   会员投稿

当你在电商平台搜索“苹果”,系统会推荐“水果”还是“手机”?或者直接跳到某个品牌旗舰店?短短一个词,背后承载了完全不同的购买意图。而推荐是否精准,直接影响用户的搜索体验,也影响平台的转化效率。

基于上述问题,快手在业界首次提出端到端的生成式统一查询推荐框架——OneSug,成功将召回、粗排、精排等多个阶段统一在一个生成模型中,显著提升了推荐效果与系统效率,在快手电商场景中实现了业务指标与用户体验的双重提升。

本工作相关成果《OneSug: The Unified End-to-End Generative Framework for E-commerce Query Suggestion》已被人工智能顶级会议 AAAI 2026 接收。

查询推荐(Query Suggestion)是现代电商搜索系统中的关键功能,通过在用户输入过程中实时推荐相关查询,帮助用户快速明确意图,提升搜索体验与转化效率。传统方法通常采用多阶段级联架构(MCA),虽然在效率与效果之间取得了一定平衡,但由于各阶段目标不一致、长尾查询召回困难等问题,限制了系统性能的进一步突破。

而近年来,生成式检索(Generative Retrieval)因其强大的语义理解与生成能力,在推荐与搜索领域展现出巨大潜力。然而,现有方法多聚焦于视频推荐,其本质上是一个开集到开集的任务,难以直接应用于输入输出都是开放词表的的查询推荐场景。

针对上述问题,快手提出的 OneSug 模型主要包括3个部分:

首先是 Prefix-Query表征增强模块。Sug场景下,用户输入的前缀往往较短且意图模糊(如“苹果”可指水果或品牌)。为此,快手提出的解决方式分为语义与业务空间对齐、层次化语义ID生成2个部分。

其次是统一的Enc-Dec生成架构。OneSug 的生成架构基于Enc-Dec结构,并直接通过自回归(Autoregressive)方式生成用户最有可能点击的Query。

此外,借助用户行为偏好对齐(RWR)的方式,通过用户偏好量化、混合排序框架奖励加权偏好优化、混合排序框架的方法,分别对用户在搜索场景下的真实行为进行了精细化分级。RWR 的核心思想是根据正负样本之间的奖励差距,让模型学习到用户对不同query的个性化偏好。

总体而言,OneSug 是业界首个在电商场景中实现全流量部署的端到端生成式Query推荐系统,其统一建模方式显著提升了语义理解与个性化推荐的能力,为生成式模型在搜广推的落地提供了新范式。

未来,我们将进一步探索大语言模型在排序阶段的强化学习优化、实时更新等方向,持续推动端到端生成式系统在推荐、广告等多业务场景中的广泛应用。

ad