WOWService – 美团推出的大模型交互系统技术报告
WOWService是什么
WOWService 是美团 LongCat 团队发布的智能交互系统,通过融合大型语言模型(LLMs)和多智能体架构,优化用户体验并降低成本。系统针对智能交互领域的五大挑战:冷启动数据构建、多轮对话性能、业务规则变化、单一 LLM 的局限性以及多轮对话的量化评估难题,提出了创新解决方案。WOWService 采用四阶段训练流水线:持续预训练(CPT)、有监督微调(SFT)、直接偏好优化(DPO)和强化学习(RL),显著提升了模型在业务场景中的表现。其多智能体架构通过主智能体与多个专业子智能体的协作,实现了复杂任务的高效处理。系统引入了数据与知识双驱动机制,通过自我优化训练(SRT)和混合数据知识驱动方法,进一步提升了模型的性能。

WOWService的主要功能
- 数据构建与优化:WOWService采用数据与知识双驱动策略,通过自适应数据混合优化和高质量数据筛选,提升模型训练效率和性能,降低数据标注成本。
- 多轮对话性能提升:系统通过持续预训练、有监督微调、直接偏好优化和强化学习四阶段训练,显著增强多轮对话中的意图理解、规则遵循和解决方案提取能力。
- 业务规则适配与自进化:WOWService具备自我优化训练机制,能够快速适应业务规则变化,实现模型的持续进化和优化,降低业务扩展成本。
- 多智能体协作:引入多智能体架构,主智能体负责全局对话控制,专业子智能体处理特定任务,提升系统在复杂场景下的服务质量和灵活性。
- 自动化评估与反馈:构建了全面的评估框架,涵盖模型基础性能和端到端智能体效果评估,通过数据反馈实现模型的持续改进。
- 多模态交互支持:WOWService支持多模态输入,如语音、图像等,通过多模态理解智能体,提升系统对非文本输入的理解能力,拓展应用场景。
WOWService的技术原理
- 数据与知识双驱动:WOWService融合数据驱动和知识驱动,通过高质量数据和结构化业务知识的结合,强化模型对业务规则和知识点的遵循能力,提升模型在复杂业务场景下的表现。
- 四阶段训练流水线:采用持续预训练(CPT)、有监督微调(SFT)、直接偏好优化(DPO)和强化学习(RL)四个阶段的训练流程,逐步提升模型的通用能力、业务适配能力和推理能力。
- 多智能体架构:引入主智能体和多个专业子智能体,主智能体负责全局对话控制,子智能体处理特定任务,通过动态调用和信息整合,实现复杂任务的高效处理。
- 自我优化训练:通过自动筛选高质量服务案例和重写低质量对话,构建自我进化的数据闭环,使模型能够持续优化并适应新的业务需求。
- 混合数据知识驱动:结合数据驱动的灵活性和知识驱动的规则适应性,通过动态知识检索和推理增强,提升模型在复杂业务流程中的准确性和可靠性。
- 强化学习与偏好优化:利用强化学习和直接偏好优化技术,使模型能够根据人类反馈进行调整,生成更符合人类偏好的输出,提升用户体验。
- 自动化评估框架:建立从模型基础性能到端到端智能体效果的全面评估体系,支持自动化评估和持续优化,确保模型在实际应用中的稳定性和高效性。
WOWService的项目地址
arXiv技术论文:https://arxiv.org/pdf/2510.13291
WOWService的应用场景
- 美团智能客服系统:WOWService已成功部署在美团App的智能客服系统中,处理用户咨询,提供24/7不间断服务,显著提升用户满意度和问题解决效率。
- 多业务场景覆盖:广泛应用于美团内部数十个业务场景,如外卖、酒店预订、旅游等,根据不同业务需求提供个性化服务。
- 复杂业务流程处理:在涉及多角色(如用户、商家、配送员)的复杂业务流程中,WOWService能够灵活调度和协调资源,确保高效信息传递和服务执行。
- 多模态交互支持:支持语音、图像等多种输入方式,为用户提供更自然、便捷的交互体验,适用于需要视觉或听觉辅助的场景。
- 主动协作与推荐:能主动挖掘用户潜在需求,提供个性化推荐和解决方案,提升用户参与度和满意度。
- 智能外呼服务:实现智能外呼功能,如订单确认、满意度调查等,提高运营效率和用户响应速度。
-
SAM Audio – Meta开源的音频分割模型
SAM Audio是什么SAM Audio是Meta开源的音频分割模型,能通过文本、视觉和时间片段等多模态提示,从复杂的音频混合中分离出特定的声音。核心技术是Perception Encoder Au
-
Molmo 2 – Ai2开源的AI视频分析模型
Molmo 2是什么Molmo 2 是艾伦人工智能研究所(Ai2)推出的开源视频分析模型,专注于视频理解、指向和追踪。模型基于 Qwen 3 和 Olmo 架构,具备强大的视频分析能力,能在视频中精准
-
LongCat-Video-Avatar – 美团开源的数字人视频生成模型
LongCat-Video-Avatar是什么LongCat-Video-Avatar 是美团 LongCat 团队推出的音频驱动角色动画模型。模型能生成超逼真、口型同步的长视频,保持人物身份一致性和
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/
- 曝小米15下周激活量能到300万台:同期销量第一
- AgenticSeek一个 100% 本地替代 Manus AI 的方案
- 69岁阿姨靠退休金自驾1500多天
- 《毒液3:最后一舞》中国首映礼布置逼真场景:带孩子的请绕行
- 华为首创的全向防碰撞系统有多强 余承东:已为车主避免77.9万次碰撞
- 特斯拉将召回27185辆Cybertruck:倒车影像延迟太高 空白8秒
- 永辉超市回应“背刺胖东来”:创始人张轩松股权比例不变
- 超市老板娘因穿着清凉被举报博流量 店面已转出:没想靠负能量赚钱 害怕再遭偷拍
- 浙江证监局对蚂蚁基金销售及公司总经理林思思给予警告并处罚款
- 极星车哪个国家的 Polestar怎么样?
- 男子两年内交通违法325次被记705分
- 网络共享单车什么意思?
关注网络尖刀微信公众号随时掌握互联网精彩



![小小雅因你而在 提前为林俊杰考察一下哈尔滨[打call]](https://imgs.knowsafe.com:8087/img/aideep/2024/1/24/4034f1c8cdf758771b8ec79b24314fe1.jpg?w=250)



