一、核心请求参数(4大关键)

1. model(模型选择)

  • 类型:字符串,必填

  • 作用:指定使用的大模型

  • 阿里云示例:通义千问系列、多模态模型等

  • 注意:通义千问Audio音频模型不支持OpenAI兼容模式

2. messages(消息对话)

  • 类型:数组,必填

  • 结构:包含角色和内容的对话历史

[
  {"role": "system", "content": "设定AI角色"},
  {"role": "user", "content": "用户提问"},
  {"role": "assistant", "content": "AI回复"}
]
  • 角色类型:user(用户)、system(系统)、assistant(助手)

3. stream(流式输出)

  • 类型:布尔值,默认false

  • false:一次性返回完整结果

  • true:边生成边输出(实时显示)

  • 注意:Qwen3网络版(思考模式)等仅支持流式输出

4. modalities(多模态输入)

  • 类型:数组,默认["text"]

  • 作用:指定输入数据类型(仅Qwen-Omni模型支持)

  • 可选值:text(文本)、image(图像)、audio(音频)、video(视频)


二、响应数据结构(JSON格式)

基础响应示例:

{
  "choices": [
    {
      "message": {
        "role": "assistant",
        "content": "我是通义千问,阿里巴巴..."
      },
      "finish_reason": "stop",
      "index": 0
    }
  ],
  "usage": {
    "prompt_tokens": 22,
    "completion_tokens": 80,
    "total_tokens": 102
  },
  "model": "qwen-plus",
  "id": "chatcmpl-99f8d040-0f49-955b-943a-21c83"
}

关键字段解析:

  1. choices数组:AI的回复内容

    • message.content:AI的实际回答

    • finish_reason:生成终止原因(stop正常结束)

  2. usage统计:Token消耗

    • prompt_tokens:输入消耗

    • completion_tokens:输出消耗

    • total_tokens:总消耗

  3. 元信息

    • model:实际使用的模型

    • id:请求唯一标识


三、Token概念(成本计算基础)

Token是什么?

  • 模型处理的最小文本单位

  • 用户输入需转换为Token才能处理

换算规则:

  • 英文:1 Token ≈ 4个字符

  • 中文:1个汉字 ≈ 1-2个Token

  • 标点/特殊字符:通常单独计为1个Token

成本控制:

  • 监控usage字段的Token统计

  • 优化提示词减少不必要的Token消耗


掌握这4个核心参数和响应数据结构,即可完成90%的大模型调用场景。关注Token消耗,按需选择流式输出,就能高效、经济地使用大模型能力。

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐