SWIFT & EvalScope：魔搭社区大模型微调部署与评测的强大利器

本文主要介绍了魔搭社区的两大重要框架 ——SWIFT 和 EvalScope。SWIFT（Scalable lightWeight Infrastructure for Fine-Tuning）是大模型与多模态大模型微调部署框架，ms-swift 3.0 已发布，支持 450 + 大模型及 150 + 多模态大模型的训练等环节，汇集多种训练技术，支持加速与量化，还提供 Web - UI 界面。Ev

歌刎

1249人浏览 · 2025-02-07 21:51:59

歌刎 · 2025-02-07 21:51:59 发布

论文｜中文文档｜ Swift2.x中文文档 | Swift3.x中文文档

更新历程查看：持续更新 | 大模型与多模态训练部署利器：魔搭社区ms-swift框架完全指南

🎉ms-swift3.0已发布PyPI，使用pip install ms-swift -U进行安装。请注意2.x与3.x之间的break change：https://swift.readthedocs.io/zh-cn/latest/Instruction/ReleaseNote3.0.html#breakchange

🍲ms-swift是魔搭社区提供的大模型与多模态大模型微调部署框架，现已支持450+大模型与150+多模态大模型的训练（预训练、微调、人类对齐）、推理、评测、量化与部署。其中大模型包括：Qwen2.5、QwQ、InternLM3、GLM4、Llama3.3、Mistral、DeepSeek-R1、Yi1.5、TeleChat2、Baichuan2、Phi4、Gemma2等模型，多模态大模型包括：Qwen2-VL、Qwen2-Audio、QVQ、Llama3.2-Vision、Llava、InternVL2.5、MiniCPM-V-2.6、GLM4v、Xcomposer2.5、Yi-VL、DeepSeek-VL2、Phi3.5-Vision、GOT-OCR2等模型。

🍔除此之外，ms-swift汇集了最新的训练技术，包括LoRA、QLoRA、Llama-Pro、LongLoRA、GaLore、Q-GaLore、LoRA+、LISA、DoRA、FourierFt、ReFT、UnSloth、和Liger等。ms-swift支持使用vLLM和LMDeploy对推理、评测和部署模块进行加速，并支持使用GPTQ、AWQ、BNB等技术对大模型和多模态大模型进行量化。为了帮助研究者和开发者更轻松地微调和应用大模型，ms-swift还提供了基于Gradio的Web-UI界面及丰富的最佳实践。

🌭有用的链接：

🍩🍎EvalScope：魔搭模型评测框架

🥝EvalScope是魔搭社区官方推出的模型评测与性能基准测试框架，专为多样化的模型评估需求而设计。它支持广泛的模型类型，包括但不限于大语言模型、多模态模型、Embedding 模型、Reranker 模型和 CLIP 模型。

🥥EvalScope还适用于多种评测场景，如端到端RAG评测、竞技场模式和模型推理性能压测等，其内置多个常用测试基准和评测指标，如MMLU、CMMLU、C-Eval、GSM8K等。此外，通过与ms-swift训练框架的无缝集成，可一键发起评测，为模型训练和评测提供全链路支持🚀

🍓有用的链接：

github：GitHub - modelscope/evalscope: A streamlined and customizable framework for efficient large model evaluation and performance benchmarking
官方文档：欢迎来到 EvalScope 中文教程！ | EvalScope
安装：安装 | EvalScope
快速上手：基本使用 | EvalScope

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

智能体还能配置MCP?手把手用百宝箱打造一个音途智游，让旅游加入语音

MCP技术社区

一个Rules+3个MCP就让你的Cursor不仅无幻觉还能自主给修Bug，甚至还能把高速回复500次提升到2500次。

3个MCP今天，我将为大家介绍一个神器级的解决方案——。经过我的实测，这3个配合能让你的 Cursor 使用自动测试并优化cursor自己写的代码，不用再手动每次复制粘贴Bug让cursor看，全程无幻觉，还能把高速回复次数提升到2500次，免费版本IDE也可以使用，把1次Token消耗当10个Tokens用，效率大大提高，极大节省消耗次数。不仅限于Cursor，Augment，Windsurf