LLM(3) - 本地如何调用模型(mac)
·
工具介绍
- 有很多不同的AI领域的模型厂商、云服务平台、聚合平台和本地工具,下面是一些对比数据。这些模型调用方式可能不一样,一般有自己的调用sdk,但现在大部分模型都会兼容openAI的规范
| 名称 | 类型 | 归属/说明 | 特点 |
|---|---|---|---|
| OpenAI | 厂商 | 美国 OpenAI 公司 | 行业标杆,开发了 GPT-3.5/4/o 系列。API 格式是事实上的行业标准。 |
| Claude | 厂商 | 美国 Anthropic 公司 | OpenAI 的主要竞争对手,擅长长文本分析和拟人化,代码能力强。 |
| Gemini | 厂商 | 美国 Google 公司 | 谷歌最强模型,原生多模态(天生理解图片/视频),上下文窗口极大。 |
| DeepSeek | 厂商 | 中国 深度求索 | 开源界的“卷王”,模型性能强且 API 价格极低,性价比极高。 |
| Qwen | 厂商 | 中国 阿里云 (通义千问) | 中文能力极强,开源生态好,Qwen2.5 是目前顶尖的开源模型之一。 |
| Ark (火山方舟) | 平台 | 中国 字节跳动 | MaaS 平台。上面托管了豆包模型和其他第三方模型,企业用的一站式服务平台。 |
| ArkBot | 应用 | 中国 字节跳动 | 通常指火山方舟上的"智能体(Bot)"服务,允许用户创建和发布特定的 AI 应用。 |
| Qianfan (千帆) | 平台 | 中国 百度智能云 | MaaS 平台。托管文心一言(Ernie)及 Llama 等多种模型,提供微调训练服务。 |
| OpenRouter | 聚合 | 第三方中转商 | 接口聚合器。一个 API Key 就能调用上述几乎所有模型(OpenAI, Claude, Gemini 等)。 |
| Ollama | 工具 | 开源软件 | 本地运行工具。让你在自己的电脑/服务器上离线运行 Llama 3, Qwen, DeepSeek 等模型。 |
ollama安装

- 安装完了之后,命令行
ollama -h,看到下面的界面说明OK了
- 可以使用
ollama pull qwen3:0.6b命令拉取你qwen3 0.6b的模型,然后使用ollama run qwen3:0.6b即可跑起来 - 然后我们可以使用sdk连接到本地跑起来的模型试一下效果,注意ollama默认模型服务会运行在11434端口,
baseUrl需要设置为http://localhost:11434,https://github.com/cloudwego/eino-ext/blob/main/components/model/ollama/chatmodel.go
ollamaCli, err := ollama.NewChatModel(ctx, &ollama.ChatModelConfig{
BaseURL: "http://localhost:11434",
Model: "qwen3:0.6b",
})
if err != nil {
return nil, fmt.Errorf("failed to create ollama client: %w", err)
}
备注
- ollama pull的模型来源是ollama模型库,这里的模型都是
gguf格式的专用于本地运行,它只有一些精品模型,没有hugging face上的全面。如果需要最新的模型或者某些特定模型,还是需要从hugging face上下载
更多推荐


所有评论(0)