谷歌：使用大模型构建端到端的对话式推荐系统

最近，大型语言模型（LLM）表现出了前所未有的自然对话能力，并将世界知识和常识推理融入语言理解中，释放了这种范式的潜力。然而，在对话式推荐系统 (CRS) 中有效利用大模型带来新的技术挑战，包括正确理解和控制复杂的对话以及从外部信息源检索。本文提供了一个使用大模型来构建端到端大规模对话推荐系统的路线图。具体的，其提出了用户偏好理解、对话管理和可解释推荐的新实现，并将其作为LLM驱动的集成架构的一部

大模型玩家

1518人浏览 · 2024-07-23 10:21:23

大模型玩家 · 2024-07-23 10:21:23 发布

在这里插入图片描述
最近，大型语言模型（LLM）表现出了前所未有的自然对话能力，并将世界知识和常识推理融入语言理解中，释放了这种范式的潜力。然而，在对话式推荐系统 (CRS) 中有效利用大模型带来新的技术挑战，包括正确理解和控制复杂的对话以及从外部信息源检索。

本文提供了一个使用大模型来构建端到端大规模对话推荐系统的路线图。具体的，其提出了用户偏好理解、对话管理和可解释推荐的新实现，并将其作为LLM驱动的集成架构的一部分。

为提高个性化，本文描述了大模型如何使用可解释的自然语言配置文件，并使用它们来调整会话级上下文。

在这里插入图片描述

论文：https://arxiv.org/abs/2305.07961

在传统的推荐系统模式中，用户只能被动的在推荐列表中消费物料，缺乏深入参与推荐机制的机会。由此当用户面对推荐系统可能带来的不佳体验时，比如流行度偏差、低效的兴趣试探、信息茧房等，常常感到束手无策。对话式推荐系统（CRS）对此带来了创新转变，它通过对话交流的方式向用户做推荐，不再单一的依赖于用户行为，而是能随着用户提供的反馈语句逐渐优化所推荐的内容。

在对话式推荐系统中，用户对推荐系统拥有更强的影响力。论文中给出 YouTube 场景下的对话式推荐系统如下，图片中左边为系统与用户的对话页面，右边为系统给出的推荐结果。淘宝的服务助手中也存在类似的对话推荐系统，但推荐内容会在对话中直接给出。

在这里插入图片描述

‍大规模语言模型集成了海量知识内容且具备强大的逻辑推理能力，能够以自然语言的形式与用户进行互动交流，与对话式推荐系统相当契合。在此背景下 Google 在 YouTube 场景中基于大语言模型 LaMDA 实现了对话式推荐系统 RecLLM，开启了对话式推荐系统的新模式。

RecLLM

如下图所示，RecLLM 的整体框架包含以下几个部分：
（1）对话管理模块，负责与用户交流并适时向推荐系统发起请求；
（2）召回模块，负责在大规模语料库中检索出适合的推荐候选集；
（3）排序模块，对推荐候选集合评分并提供推荐理由；
（4）用户画像模块，负责形成可解释性的用户兴趣并参与推荐流程；
（5）用户模拟器，模拟用户以生成对话示例，在系统冷启时作为样本对各个模块中的 LLM 做微调。

在这里插入图片描述

对话管理

对话管理模块的核心功能包括两部分，其一是实现与用户的互动交流，其二是适时向推荐系统发起请求，以刷新推荐列表。为实现推荐职能，要求对话管理模块能够在与用户的交流中，有效的将对话引导至推荐相关话题，但引导的过程不能太生硬，即要注意对话的自然流畅、掌握恰当的时机和交流方法来启发用户以抽取其兴趣喜好。对话管理模块通过 LLM 驱动，上述话题引导的功能需特定数据对模型做微调来强化。

输入到大模型中的数据可分为三个部分，如下图所示。首先是 Dialogue，它涵盖了会话的上下文信息；其次是 User Profile 用户画像，其生成逻辑在下文讲解；最后是 Item Summary，为当前推荐内容的概述。模型的输出同样分为三个部分：首先是 Context tracking，对会话上下文的总结；其次是 Instruction，即由模型产生的指令，这两个部分类似于思维链，为后续步骤的正确推理做铺垫。最终部分为 Response，它包括两种输出形式：“Response:”旨在与用户进行交流，而“Request:”则用于向推荐系统发起请求。

在这里插入图片描述

召回

在这里插入图片描述

论文探讨了四种不同的推荐召回策略，如上图表格。首先是“Generalized Dual Encoder Model”，即最常用的双塔召回方法。由于 RecLLM 策略的设计理念是仅通过分析用户的对话内容来抓取用户的兴趣点，而不依赖于任何点击或其它行为数据，因此无法使用行为样本训练双塔。RecLLM 将会话上下文等用户信息输入至 LLM，直接使用其隐藏层作为用户向量，而物料向量则依赖于其他业务场景中已有的物料表示。然而，未经训练的方式无法确保用户和物料向量处于同一语义空间内，这导致了较差的性能表现；第二种是“Direct LLM Search”召回，通过 LLM 直接生成物料的 ID 或标题，进而在物料库中进行匹配。这种方法的缺点是，对大模型做微调既耗时又劳力，并且无法应对物料库的频繁更新；第三种方法为“Concept Based Search”，这是对双塔召回的改进。在这种方式中，LLM 输出一组相关“概念”，并利用“Concept Activation Vectors”将这些概念聚合并映射到物品表示空间中，从而确保用户和物品在相同的语义空间内。尽管如此，概念生成和概念激活向量的使用可能会损失一定的准确性，进而影响推荐精度；最后一种是“Search API Lookup”召回策略，这里大模型生成的是搜索查询 query，随后利用已经存在于业务中的搜索 API 来获得推荐内容。

排序

在这里插入图片描述

召回生成的候选集中的每一物料都将逐一被 LLM 打分，并同时生成语言解释，其流程如上图。由于内容冗长，物料的 Item Metadata（例如视频字幕、用户评论等）和用户对话上下文 Context 都需经过总结处理后再输入到 LLM 中。随后，该模型会输出评分以及语言解释，语言解释除了向用户展示外，也起到了思维链的作用。

用户画像

虽然用户在会话过程可以明确表达自身喜好，但为了提供更加个性化的体验，创建用户画像仍然十分必要。例如，如果用户指出他们不喜欢看偶像剧，那么应该在用户画像中记录该偏好，有助于避免未来用户重复提及。文本形式的用户画像不仅解释性强，而且还允许用户自己手动进行编辑和调整。

用户画像由三个关键部分组成。首先，Memory Extraction 负责使用 LLM 识别并记录用户显著的喜好表达，例如识别“我不喜欢看偶像剧”，并将其加入到用户画像。其次，Triggering and Retrieval 负责匹配每轮的对话内容与用户画像之间的文本相似性，由此筛选出所需要使用的用户画像。最后，System Integration 解决是关于如何将代表长期兴趣的用户画像与当前对话内容集成，即使它们相互矛盾，仍能够融合到一起的问题。例如，一个用户可能平时不喜欢偶像剧，但由于对某个热点事件感兴趣，可能暂时需要查找特定的偶像剧。同样，RecLLM 将两者统一输入至 LLM，借助于其强大的文本理解能力和推理能力来解决这一矛盾。

数据模拟和微调

用户模拟器的任务是仿真用户与对话式推荐系统（CRS）的交互响应。为了确保用户模拟器的真实性，它与 CRS 互动所产生的对话分布 Q 应和真实用户与 CRS 的对话分布 R 无差异。RecLLM 提出了衡量两分布差异性的三种不同策略。第一种方法依赖于人工判断；第二种方法涉及创建分类器以确定样本是否来自真实分布；第三种方法则是构建对话的主题、情感和用户意图等细粒度分类器，精准的评估两个分布间的差异。

用户模拟器通过 LLM 实现，为了确保其真实性，RecLLM 提出了两种控制策略。第一种为全局对话控制，涉及通过类似用户画像声明作为输入来引导 LLM，例如：“I am a twelve year old boy who enjoys painting and video games”。第二种则是单次对话控制，利用用户在其他业务中的行为序列（例如搜索引擎中的 Query 序列）实现对用户对话轨迹的模拟。使用用户模拟器便可生成微调 LLM 的样本，例如额外输入提示词“在第 j 轮对话中提出生成 x 物料推荐的需求”。召回和排序阶段使用模拟的数据来微调即可。其中在召回阶段中为解决样本选择偏差问题需要额外负采样。对于对话管理模块，使用了 RLHF 算法来微调。
在这里插入图片描述

零基础如何学习大模型 AI

领取方式在文末

为什么要学习大模型？

学习大模型课程的重要性在于它能够极大地促进个人在人工智能领域的专业发展。大模型技术，如自然语言处理和图像识别，正在推动着人工智能的新发展阶段。通过学习大模型课程，可以掌握设计和实现基于大模型的应用系统所需的基本原理和技术，从而提升自己在数据处理、分析和决策制定方面的能力。此外，大模型技术在多个行业中的应用日益增加，掌握这一技术将有助于提高就业竞争力，并为未来的创新创业提供坚实的基础。

大模型实际应用案例分享

①智能客服：某科技公司员工在学习了大模型课程后，成功开发了一套基于自然语言处理的大模型智能客服系统。该系统不仅提高了客户服务效率，还显著降低了人工成本。
②医疗影像分析：一位医学研究人员通过学习大模型课程，掌握了深度学习技术在医疗影像分析中的应用。他开发的算法能够准确识别肿瘤等病变，为医生提供了有力的诊断辅助。
③金融风险管理：一位金融分析师利用大模型课程中学到的知识，开发了一套信用评分模型。该模型帮助银行更准确地评估贷款申请者的信用风险，降低了不良贷款率。
④智能推荐系统：一位电商平台的工程师在学习大模型课程后，优化了平台的商品推荐算法。新算法提高了用户满意度和购买转化率，为公司带来了显著的增长。
…
这些案例表明，学习大模型课程不仅能够提升个人技能，还能为企业带来实际效益，推动行业创新发展。

学习资料领取

如果你对大模型感兴趣，可以看看我整合并且整理成了一份AI大模型资料包，需要的小伙伴文末免费领取哦，无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发
在这里插入图片描述

部分资料展示

一、 AI大模型学习路线图

整个学习分为7个阶段
在这里插入图片描述

二、AI大模型实战案例

涵盖AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，皆可用。
在这里插入图片描述

三、视频和书籍PDF合集

从入门到进阶这里都有，跟着老师学习事半功倍。
在这里插入图片描述

在这里插入图片描述

如果二维码失效，可以点击下方链接，一样的哦
【CSDN大礼包】最新AI大模型资源包，这里全都有！无偿分享！！！

😝朋友们如果有需要的话，可以V扫描下方二维码联系领取~
在这里插入图片描述

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

8种封装的1700V国产碳化硅(SiC)功率模块产品介绍及应用

MCP技术社区

（一篇入门）汽车电子电器之电机MCU控制器四

MCP技术社区

基于Echarts的甘特图实现与封装实战

Echarts（Enterprise Charts）是由百度开源的一款功能强大、高度可定制的JavaScript数据可视化库，广泛应用于各类企业级Web应用中。其核心设计理念是“以数据驱动视图”，通过声明式配置即可实现复杂图表的渲染与交互。在现代前端工程化背景下，Echarts不仅支持静态图表展示，更具备动态更新、大数据量处理和跨平台兼容等高级能力，成为构建高性能数据看板、实时监控系统和项目管理工