大模型调用：参数与响应

笨蛋不要掉眼泪

451人浏览 · 2026-02-02 17:34:40

笨蛋不要掉眼泪 · 2026-02-02 17:34:40 发布

一、核心请求参数（4大关键）

1. model（模型选择）

类型：字符串，必填
作用：指定使用的大模型
阿里云示例：通义千问系列、多模态模型等
注意：通义千问Audio音频模型不支持OpenAI兼容模式

2. messages（消息对话）

类型：数组，必填
结构：包含角色和内容的对话历史

[
  {"role": "system", "content": "设定AI角色"},
  {"role": "user", "content": "用户提问"},
  {"role": "assistant", "content": "AI回复"}
]

角色类型：user（用户）、system（系统）、assistant（助手）

3. stream（流式输出）

类型：布尔值，默认false
false：一次性返回完整结果
true：边生成边输出（实时显示）
注意：Qwen3网络版（思考模式）等仅支持流式输出

4. modalities（多模态输入）

类型：数组，默认["text"]
作用：指定输入数据类型（仅Qwen-Omni模型支持）
可选值：text（文本）、image（图像）、audio（音频）、video（视频）

二、响应数据结构（JSON格式）

基础响应示例：

{
  "choices": [
    {
      "message": {
        "role": "assistant",
        "content": "我是通义千问，阿里巴巴..."
      },
      "finish_reason": "stop",
      "index": 0
    }
  ],
  "usage": {
    "prompt_tokens": 22,
    "completion_tokens": 80,
    "total_tokens": 102
  },
  "model": "qwen-plus",
  "id": "chatcmpl-99f8d040-0f49-955b-943a-21c83"
}

关键字段解析：

choices数组：AI的回复内容
- message.content：AI的实际回答
- finish_reason：生成终止原因（stop正常结束）
usage统计：Token消耗
- prompt_tokens：输入消耗
- completion_tokens：输出消耗
- total_tokens：总消耗
元信息：
- model：实际使用的模型
- id：请求唯一标识

三、Token概念（成本计算基础）

Token是什么？

模型处理的最小文本单位
用户输入需转换为Token才能处理

换算规则：

英文：1 Token ≈ 4个字符
中文：1个汉字 ≈ 1-2个Token
标点/特殊字符：通常单独计为1个Token

成本控制：

监控usage字段的Token统计
优化提示词减少不必要的Token消耗

掌握这4个核心参数和响应数据结构，即可完成90%的大模型调用场景。关注Token消耗，按需选择流式输出，就能高效、经济地使用大模型能力。

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

【无标题】

MCP技术社区

Harvey Labs 使用教程（自用版）

MCP技术社区

[智能体-560]：Hermes在langchain基础之上的封装，做了哪些增强？

Hermes 以 LangChain 组件、LangGraph 状态图为底层底座，在上层新增五层持久记忆、自进化技能沉淀、MCP 工具总线、工具异常自愈、多端统一网关、内置可观测、本地模型专项优化、标准化项目脚手架八大能力，把零散的 LangChain 底层组件封装为开箱即用、可长期迭代的完整自主智能体运行时，大幅减少重复工程代码。