SWIFT & EvalScope:魔搭社区大模型微调部署与评测的强大利器
本文主要介绍了魔搭社区的两大重要框架 ——SWIFT 和 EvalScope。SWIFT(Scalable lightWeight Infrastructure for Fine-Tuning)是大模型与多模态大模型微调部署框架,ms-swift 3.0 已发布,支持 450 + 大模型及 150 + 多模态大模型的训练等环节,汇集多种训练技术,支持加速与量化,还提供 Web - UI 界面。Ev
论文 | 中文文档 | Swift2.x中文文档 | Swift3.x中文文档
🎉ms-swift3.0已发布PyPI,使用pip install ms-swift -U进行安装。请注意2.x与3.x之间的break change:https://swift.readthedocs.io/zh-cn/latest/Instruction/ReleaseNote3.0.html#breakchange
🍲ms-swift是魔搭社区提供的大模型与多模态大模型微调部署框架,现已支持450+大模型与150+多模态大模型的训练(预训练、微调、人类对齐)、推理、评测、量化与部署。其中大模型包括:Qwen2.5、QwQ、InternLM3、GLM4、Llama3.3、Mistral、DeepSeek-R1、Yi1.5、TeleChat2、Baichuan2、Phi4、Gemma2等模型,多模态大模型包括:Qwen2-VL、Qwen2-Audio、QVQ、Llama3.2-Vision、Llava、InternVL2.5、MiniCPM-V-2.6、GLM4v、Xcomposer2.5、Yi-VL、DeepSeek-VL2、Phi3.5-Vision、GOT-OCR2等模型。
🍔除此之外,ms-swift汇集了最新的训练技术,包括LoRA、QLoRA、Llama-Pro、LongLoRA、GaLore、Q-GaLore、LoRA+、LISA、DoRA、FourierFt、ReFT、UnSloth、和Liger等。ms-swift支持使用vLLM和LMDeploy对推理、评测和部署模块进行加速,并支持使用GPTQ、AWQ、BNB等技术对大模型和多模态大模型进行量化。为了帮助研究者和开发者更轻松地微调和应用大模型,ms-swift还提供了基于Gradio的Web-UI界面及丰富的最佳实践。
🌭有用的链接:
- github:GitHub - modelscope/ms-swift: Use PEFT or Full-parameter to finetune 450+ LLMs (Qwen2.5, InternLM3, GLM4, Llama3.3, Mistral, Yi1.5, Baichuan2, DeepSeek-R1, ...) and 150+ MLLMs (Qwen2.5-VL, Qwen2-Audio, Llama3.2-Vision, Llava, InternVL2.5, MiniCPM-V-2.6, GLM4v, Xcomposer2.5, Yi-VL, DeepSeek-VL2, Phi3.5-Vision, GOT-OCR2, ...).
- paper:[2408.05517] SWIFT:A Scalable lightWeight Infrastructure for Fine-Tuning
- 文档:Swift DOCUMENTATION — swift 3.1.0.dev0 文档
- examples:ms-swift/examples at main · modelscope/ms-swift · GitHub
- 常见问题整理: 常见问题整理 — swift 3.1.0.dev0 文档
- 意见箱: ms-swift3 Suggestion Box · Issue #2217 · modelscope/ms-swift · GitHub
- modelscope钉钉群: 44837352
🍩🍎EvalScope:魔搭模型评测框架
🥝EvalScope是魔搭社区官方推出的模型评测与性能基准测试框架,专为多样化的模型评估需求而设计。它支持广泛的模型类型,包括但不限于大语言模型、多模态模型、Embedding 模型、Reranker 模型和 CLIP 模型。
🥥EvalScope还适用于多种评测场景,如端到端RAG评测、竞技场模式和模型推理性能压测等,其内置多个常用测试基准和评测指标,如MMLU、CMMLU、C-Eval、GSM8K等。此外,通过与ms-swift训练框架的无缝集成,可一键发起评测,为模型训练和评测提供全链路支持🚀
🍓有用的链接:
更多推荐
所有评论(0)