LLM(3) - 本地如何调用模型(mac)

Coming Liu

778人浏览 · 2026-01-19 10:12:43

Coming Liu · 2026-01-19 10:12:43 发布

工具介绍

有很多不同的AI领域的模型厂商、云服务平台、聚合平台和本地工具，下面是一些对比数据。这些模型调用方式可能不一样，一般有自己的调用sdk，但现在大部分模型都会兼容openAI的规范

名称	类型	归属/说明	特点
OpenAI	厂商	美国 OpenAI 公司	行业标杆，开发了 GPT-3.5/4/o 系列。API 格式是事实上的行业标准。
Claude	厂商	美国 Anthropic 公司	OpenAI 的主要竞争对手，擅长长文本分析和拟人化，代码能力强。
Gemini	厂商	美国 Google 公司	谷歌最强模型，原生多模态（天生理解图片/视频），上下文窗口极大。
DeepSeek	厂商	中国深度求索	开源界的“卷王”，模型性能强且 API 价格极低，性价比极高。
Qwen	厂商	中国阿里云 (通义千问)	中文能力极强，开源生态好，Qwen2.5 是目前顶尖的开源模型之一。
Ark (火山方舟)	平台	中国字节跳动	MaaS 平台。上面托管了豆包模型和其他第三方模型，企业用的一站式服务平台。
ArkBot	应用	中国字节跳动	通常指火山方舟上的"智能体(Bot)"服务，允许用户创建和发布特定的 AI 应用。
Qianfan (千帆)	平台	中国百度智能云	MaaS 平台。托管文心一言(Ernie)及 Llama 等多种模型，提供微调训练服务。
OpenRouter	聚合	第三方中转商	接口聚合器。一个 API Key 就能调用上述几乎所有模型（OpenAI, Claude, Gemini 等）。
Ollama	工具	开源软件	本地运行工具。让你在自己的电脑/服务器上离线运行 Llama 3, Qwen, DeepSeek 等模型。

ollama安装

登录官网
https://ollama.com/

在这里插入图片描述

安装完了之后，命令行ollama -h，看到下面的界面说明OK了
可以使用ollama pull qwen3:0.6b命令拉取你qwen3 0.6b的模型，然后使用ollama run qwen3:0.6b即可跑起来
然后我们可以使用sdk连接到本地跑起来的模型试一下效果，注意ollama默认模型服务会运行在11434端口，baseUrl需要设置为http://localhost:11434，https://github.com/cloudwego/eino-ext/blob/main/components/model/ollama/chatmodel.go

ollamaCli, err := ollama.NewChatModel(ctx, &ollama.ChatModelConfig{
	BaseURL: "http://localhost:11434",
	Model:   "qwen3:0.6b",
})
if err != nil {
	return nil, fmt.Errorf("failed to create ollama client: %w", err)
}

备注

ollama pull的模型来源是ollama模型库，这里的模型都是gguf格式的专用于本地运行，它只有一些精品模型，没有hugging face上的全面。如果需要最新的模型或者某些特定模型，还是需要从hugging face上下载

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

ComAct：工业 Agent 为什么要把专业软件变成可执行动作

MCP技术社区

AI Agent RAG 中的 Lost in the Middle：检索到了但模型不用怎么办？

MCP技术社区

AI Agent 核心原理：工具调用（Function Calling）完整工作流程详解

name：工具的唯一标识，Agent 通过名称匹配执行对应的函数：工具的功能语义描述，模型依靠它判断 “什么时候该用这个工具”，描述越精准，调用准确率越高parameters：工具的入参规范，模型会按照这个格式从用户问题中提取对应参数工具调用（Function Calling）是大模型能力的重要拐点：它让大模型突破了自身静态知识的边界，获得了对接真实世界的能力。而 Agent 正是这套能力的载体与