大模型调用:参数与响应
·
一、核心请求参数(4大关键)
1. model(模型选择)
-
类型:字符串,必填
-
作用:指定使用的大模型
-
阿里云示例:通义千问系列、多模态模型等
-
注意:通义千问Audio音频模型不支持OpenAI兼容模式
2. messages(消息对话)
-
类型:数组,必填
-
结构:包含角色和内容的对话历史
[
{"role": "system", "content": "设定AI角色"},
{"role": "user", "content": "用户提问"},
{"role": "assistant", "content": "AI回复"}
]
-
角色类型:user(用户)、system(系统)、assistant(助手)
3. stream(流式输出)
-
类型:布尔值,默认
false -
false:一次性返回完整结果
-
true:边生成边输出(实时显示)
-
注意:Qwen3网络版(思考模式)等仅支持流式输出
4. modalities(多模态输入)
-
类型:数组,默认
["text"] -
作用:指定输入数据类型(仅Qwen-Omni模型支持)
-
可选值:text(文本)、image(图像)、audio(音频)、video(视频)
二、响应数据结构(JSON格式)
基础响应示例:
{
"choices": [
{
"message": {
"role": "assistant",
"content": "我是通义千问,阿里巴巴..."
},
"finish_reason": "stop",
"index": 0
}
],
"usage": {
"prompt_tokens": 22,
"completion_tokens": 80,
"total_tokens": 102
},
"model": "qwen-plus",
"id": "chatcmpl-99f8d040-0f49-955b-943a-21c83"
}
关键字段解析:
-
choices数组:AI的回复内容
-
message.content:AI的实际回答 -
finish_reason:生成终止原因(stop正常结束)
-
-
usage统计:Token消耗
-
prompt_tokens:输入消耗 -
completion_tokens:输出消耗 -
total_tokens:总消耗
-
-
元信息:
-
model:实际使用的模型 -
id:请求唯一标识
-
三、Token概念(成本计算基础)
Token是什么?
-
模型处理的最小文本单位
-
用户输入需转换为Token才能处理
换算规则:
-
英文:1 Token ≈ 4个字符
-
中文:1个汉字 ≈ 1-2个Token
-
标点/特殊字符:通常单独计为1个Token
成本控制:
-
监控
usage字段的Token统计 -
优化提示词减少不必要的Token消耗
掌握这4个核心参数和响应数据结构,即可完成90%的大模型调用场景。关注Token消耗,按需选择流式输出,就能高效、经济地使用大模型能力。
更多推荐


所有评论(0)