大模型应用编排工具Dify二开之接入LLM改造

在大模型项目落地过程中，由于安全、合规和管控等原因不会直接使用原生开源大模型，一般会在开源大模型的基础上添加额外的认证信息或者修改接口访问方式。本次的目标是通过修改 dify源码能够对接**不遵守标准 openai接口协议**，在 header里面添加了**额外认证信息**的开源大模型。

Daphnis_z

3399人浏览 · 2024-11-15 22:45:00

Daphnis_z · 2024-11-15 22:45:00 发布

1.前言

在大模型项目落地过程中，由于安全、合规和管控等原因不会直接使用原生开源大模型，一般会在开源大模型的基础上添加额外的认证信息或者修改接口访问方式。本次的目标是通过修改 dify源码能够对接不遵守标准 openai接口协议，在 header里面添加了额外认证信息的开源大模型。

环境信息：dify-0.8.3, docker-21

2.定位对接大模型代码

dify对接开源大模型的代码在 openai_api_compatible模块中，具体的路径是 api\core\model_runtime\model_providers\openai_api_compatible，工程结构如下：

在这里插入图片描述

其中 openai_api_compatible.yaml可以配置界面上填写的连接信息，如下：

provider: openai_api_compatible
label:
  en_US: OpenAI-API-compatible
description:
  en_US: Model providers compatible with OpenAI's API standard, such as LM Studio.
  zh_Hans: 兼容 OpenAI API 的模型供应商，例如 LM Studio 。
supported_model_types:
  - llm
  - text-embedding
  - speech2text
configurate_methods:
  - customizable-model
model_credential_schema:
  model:
    label:
      en_US: Model Name
      zh_Hans: 模型名称
    placeholder:
      en_US: Enter full model name
      zh_Hans: 输入模型全称
  credential_form_schemas:
    - variable: capability_name
      label:
        zh_Hans: Capability Name
        en_US: Capability Name
      type: text-input
      required: true
      placeholder:
        zh_Hans: Capability Name
        en_US: Capability Name
    - variable: app_key
      label:
        zh_Hans: APP Key
        en_US: APP Key
      type: text-input
      required: true
      placeholder:
        zh_Hans: APP Key
        en_US: APP Key
...

llm.py则是连接大模型和对话的核心代码，本次也是修改此文件。

3.修改大模型验证连接代码

3.1修改添加模型页面

原始页面：

在这里插入图片描述

修改后页面：

在这里插入图片描述

修改 openai_api_compatible.yaml文件，如下：

...
  credential_form_schemas:
    - variable: capability_name
      label:
        zh_Hans: Capability Name
        en_US: Capability Name
      type: text-input
      required: true
      placeholder:
        zh_Hans: Capability Name
        en_US: Capability Name
    - variable: app_key
      label:
        zh_Hans: APP Key
        en_US: APP Key
      type: text-input
      required: true
      placeholder:
        zh_Hans: APP Key
        en_US: APP Key
    - variable: checksum_key
      label:
        zh_Hans: Checksum 校验密钥
        en_US: Checksum validation key
      type: text-input
      required: true
      placeholder:
        zh_Hans: Checksum key
        en_US: Checksum key
...

text-input是文本输入框，required: true设置必填。

3.2修改模型验证后台代码

本次修改的内容是往 header里面添加额外的认证信息，需要修改 llm.py文件，需要修改的地方如下：

# 生成调用XX大模型需要的 header
def gen_xx_llm_headers(self,credentials):
		# 添加生成 header的逻辑
        ...
        
        return {
            "X-CurTime": cur_time,
            "appKey": app_key,
            "X-Server-Param": server_param,
            "X-CheckSum": checksum,
        }


def validate_credentials(self, model: str, credentials: dict) -> None:
        """
        Validate model credentials using requests to ensure compatibility with all providers following
         OpenAI's API standard.

        :param model: model name
        :param credentials: model credentials
        :return:
        """
        try:
            headers = {
                "Content-Type": "application/json",
                **self.gen_xx_llm_headers(credentials)
                }

            api_key = credentials.get("api_key")
            if api_key:
                headers["Authorization"] = f"Bearer {api_key}"
...

4.修改大模型对话接口代码

也是修改 llm.py文件，需要修改的地方如下：

    # validate_credentials method has been rewritten to use the requests library for compatibility with all providers
    # following OpenAI's API standard.
    def _generate(
        self,
        model: str,
        credentials: dict,
        prompt_messages: list[PromptMessage],
        model_parameters: dict,
        tools: Optional[list[PromptMessageTool]] = None,
        stop: Optional[list[str]] = None,
        stream: bool = True,
        user: Optional[str] = None,
    ) -> Union[LLMResult, Generator]:
        """
        Invoke llm completion model

        :param model: model name
        :param credentials: credentials
        :param prompt_messages: prompt messages
        :param model_parameters: model parameters
        :param stop: stop words
        :param stream: is stream response
        :param user: unique user id
        :return: full response or stream response chunk generator result
        """
        logger.info(f"start call llm, credentials: {credentials}")

        headers = {
            "Content-Type": "application/json",
            "Accept-Charset": "utf-8",
            **self.gen_xx_llm_headers(credentials),
        }
        extra_headers = credentials.get("extra_headers")
        if extra_headers is not None:
            headers = {
                **headers,
                **extra_headers,
            }
...

5.总结

本次源码改造只涉及连接大模型时的 header，并不复杂，仔细阅读 dify的源码，理解流程就能修改。

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

平板选大屏：2025年最大平板屏幕TOP5推荐！

若追求屏幕尺寸与AI功能的前沿融合,荣耀MagicPad 3的165Hz护眼大屏、12450mAh青海湖电池及免费AI PPT等创新,使其成为当前“大屏AI化”的引领者。2025年的平板市场迎来一波“大屏革命”,13英寸以上的超大屏搭配旗舰性能与AI赋能,彻底模糊了平板与笔记本的界限。作为首款“AI全场景赋能”的平板,MagicPad 3从护眼、续航到交互,重新定义了大屏平板的体验上限。整合AI离

MCP技术社区

2025年计算机行业选择分析报告

工业和信息化部、中央网信办等四部门联合印发《国家人工智能产业综合标准化体系建设指南（2024版）》，提出到2026年，我国人工智能产业标准与产业科技创新的联动水平持续提升，新制定国家标准和行业标准50项以上，引领人工智能产业高质量发展的标准体系加快形成。传统的初级编码岗位和一些过时技术栈面临被淘汰的风险。从板块表现来看，截至2025年2月7日收盘，计算机指数较年初上涨11.01%，同期沪深300指

MCP技术社区

通义灵码2.5来袭！MCP 功能直接让开发效率提升300%（附实战案例）

通义灵码2.5是阿里云推出的AI编码助手，以智能协作为核心，深度融合开发全流程。其三大升级点包括：编程智能体实现任务自主规划、MCP工具生态支持自然语言生成SQL、记忆进化系统个性化适配开发者习惯。通过自然语言即可完成数据库操作、代码生成与优化，大幅提升开发效率。此外，还具备工程级变更管理、多文件协同编辑及版本控制功能，适用于多种IDE环境，为企业提供安全高效的开发解决方案。