rag学习5

以灰桦

225人浏览 · 2026-06-14 22:16:15

以灰桦 · 2026-06-14 22:16:15 发布

本周基于 LangChain 框架完成了支持多轮对话的 RAG 检索增强问答服务开发，编写RagService核心类，整合通义大模型、DashScope 向量嵌入模型与自研向量库服务，依托配置文件统一管理模型参数，完成各项基础组件的初始化搭建。

本次开发中设计了专属提示词模板，通过ChatPromptTemplate搭配MessagesPlaceholder预留对话历史位置，明确模型应答要求，优先结合检索到的参考资料作答。同时自定义函数完成检索文档内容、元数据的格式化处理，规范数据展示形式。

项目运用 LangChain 各类 Runnable 组件完成链路编排，借助RunnablePassthrough实现数据透传、RunnableLambda完成自定义数据转换，串联文档检索、数据处理、提示词拼接、模型调用、结果解析全流程，并使用StrOutputParser统一输出格式。

本次实践掌握了 LangChain 链式调用逻辑与 RAG 完整业务流程，通过RunnableWithMessageHistory对接历史会话读取接口，实现问答场景的上下文记忆能力。后续将开展功能测试，优化文档格式化逻辑，并进一步拓展服务适配更多业务场景。

from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough, RunnableWithMessageHistory, RunnableLambda

from file_history_store import get_history
from vectoer_stores import VectorStoreService
from langchain_community.embeddings import DashScopeEmbeddings
import config_data as config
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_community.chat_models.tongyi import ChatTongyi
from langchain_core.documents import Document

class RagService:
    def __init__(self):
        self.vector_service = VectorStoreService(embedding = DashScopeEmbeddings(model = config.embedding_model_name ))

        self.prompt_template = ChatPromptTemplate.from_messages(
            [
                ("system","以我提供的已知参考资料为主，简洁和专业的回答用户问题。参考资料{context}"),
                ("system", "并且我提供的用户的历史对话如下"),
                MessagesPlaceholder("history"),
                ("user", "请回答用户提问：{input}")
            ]
        )

        self.chat_model = ChatTongyi(model = config.chat_model_name)

        self.chain = self.__get_chain()

    def __get_chain(self) :

        retriever = self.vector_service.get_retriever()

        def format_document(docs: list[Document]) :
            if not docs :
                return "没有参考资料"

            formatted_str = ""
            for doc in docs :
                formatted_str += f"文档片段：{doc.page_content}\n文档原数据：{doc.metadata}\n"

            return formatted_str

        def format_for_retriever(value):
            return value["input"]

        def format_for_prompt_template(value):
            new_dict = {}
            new_dict["input"] = value["input"]["input"]
            new_dict["context"] = value["context"]
            new_dict["history"] = value["input"]["history"]
            return new_dict



        chain = (
            {"input":RunnablePassthrough() ,
             "context":RunnableLambda(format_for_retriever)| retriever | format_document}
            |RunnableLambda(format_for_prompt_template)
            | self.prompt_template
            | self.chat_model
            | StrOutputParser()
        )

        conversation_chain =RunnableWithMessageHistory(
            chain,
            get_history,
            input_messages_key="input",
            history_messages_key="history",
        )


        return conversation_chain

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

AI Agent Harness实时视频流交互管控

AI Agent Harness实时视频流交互管控平台（以下简称“Harness平台”）正是为了解决上述痛点而生的。它是一个低代码、高可扩展、端边云协同的平台，核心思想是将离散的AI能力（VLM目标检测/跟踪/分割、LLM自然语言理解/推理、RL任务规划/执行、TTS/ASR语音交互、SLAM定位导航等）封装成标准化的“AI Agent单元”，同时提供统一的视频流接入、编解码、预处理、存储、分发模

MCP技术社区

开源AI Agent Harness框架选型与对比

你是否曾有过这样的经历？2024年上半年，我所在的某互联网大厂做过一个内部统计：生产级落地1个单技能Agent，平均需要8-12周；落地10个不同领域的Agent，平均需要24-36周，Agent Harness（或者叫Agent Infrastructure、Agent Control Plane、Agent Orchestration Layer）**。

MCP技术社区

AI Agent Harness Engineering 决策逻辑拆解：强化学习与符号推理的融合实践

属性维度纯RL（主流DRL）纯SR（Prolog/KG+规则）Hybrid RL-SR（带决策 harness）直觉试错能力✅ 极强❌ 几乎没有✅ 强：由RL模块负责，在SR模块的约束下试错动态适应能力✅ 较强❌ 极差✅ 强：RL模块负责快速适应环境变化，SR模块负责定期/半自动更新知识库/规则库长尾/开放场景泛化❌ 极差✅ 较强✅ 极强：RL模块处理已覆盖的复杂场景，SR模块基于知识组合/类比处