09 Jan 13:42

tastelikefeet

v1.5.2

e1a6187

v1.5.2

English Version

Support show log in text box of web-ui
Support share=True in web-ui, only need to set WEBUI_SHARE=1 in environment variable
Support deactivate all adapters
Support more SFT arguments
Add longlora/qalora script
Support custom models in web-ui
ModelScope SWIFT studio released: https://www.modelscope.cn/studios/damo/Scalable-lightWeight-Infrastructure-for-Fine-Tuning/summary
Fix some bugs

中文版本

支持在web-ui中直接显示日志
支持share=True 仅需要在环境变量中设置WEBUI_SHARE=1
支持失活所有adapters
添加了更多SFT参数
添加了longlora/qalora的训练脚本
web-ui支持了自己注册的自定义模型
SWFT魔搭创空间上线了: https://www.modelscope.cn/studios/damo/Scalable-lightWeight-Infrastructure-for-Fine-Tuning/summary
修复了一些bug

What's Changed

fix chatglm3 template bug by @Jintao-Huang in #298
Support studio by @tastelikefeet in #300
fix text label by @tastelikefeet in #301
fix a bug may cause module on gpu throws error by @tastelikefeet in #302
fix_ziya_template_bug by @Jintao-Huang in #303

Full Changelog: v1.5.1...v1.5.2

Contributors

Jintao-Huang and tastelikefeet

Assets 2

07 Jan 12:36

tastelikefeet

v1.5.1

d9756cd

v1.5.1

English version

New Features

Support dtype settings in LoRA
Support deactivated tuners offloading
Support deployment with OpenAI format restful API
Make LongLoRA supports the latest llama2 code

新feature

支持LoRA设置dtype类型
支持将不使用的tuners offloading到cpu和meta设备上
支持OpenAI restful API方式的部署
LongLoRA支持最新的llama2代码

What's Changed

update docs by @tastelikefeet in #269
Update benchmark 0101 by @Jintao-Huang in #271
update benchmark by @Jintao-Huang in #276
Support dtype in lora by @tastelikefeet in #278
Support deploy by @Jintao-Huang in #275
update deploy client by @Jintao-Huang in #279
Support offload by @tastelikefeet in #281
fix tuner bug by @Jintao-Huang in #285
Support lora_modules_to_save by @Jintao-Huang in #284
update template by @Jintao-Huang in #286
support ModuleToSave original module offloading by @tastelikefeet in #282
Fix offload by @tastelikefeet in #288
fix scedit bug by @tastelikefeet in #290
fix bnb qwen bug by @Jintao-Huang in #289
update readme by @Jintao-Huang in #291
update readme by @Jintao-Huang in #292
Fix/longlora by @tastelikefeet in #294
support additional_trainable_parameters by @Jintao-Huang in #295
fix webui by @tastelikefeet in #296
fix trainer push to hub by @Jintao-Huang in #297

Full Changelog: v1.5.0...v1.5.1

Contributors

Jintao-Huang and tastelikefeet

Assets 2

01 Jan 06:09

tastelikefeet

v1.5.0

0e85993

v1.5.0

English Version

New features:

Support multi-line inference
Support multi node training
Add benchmarks
Support UI training, start by swift web-ui
Support VLLM inference
Support RLHF(DPO) training

New tuners:

SCEdit, adopted by TongYi Lab, uses lesser memory but produces better performance than LoRA, and can be used to replace ControlNet in a series of scenarios like Pose control/In-Painting/Out-Paining/Label-removing, etc.

New models:

SUS series models
Mixtral-MoE series models
deepseek series models
phi2-3b
cogagent-chat/cogagent-vqa
codegeex2-6b

New datasets:

Datasets used in RLHF:

hh-rlhf
stack-exchange-paired

中文版

SWIFT本月新版本已经发布！

新特性:

支持多行输入推理
支持多卡训练
添加了模型训练的benchmarks
支持界面训练和推理，通过swift web-ui开启
支持VLLM推理
支持RLHF(DPO)训练

新tuners:

SCEdit: 通义实验室自研的优秀U-Net微调框架，显存占用远小于LoRA，效果较LoRA更好，且可以替代实现ControlNet的效果，实现In-Painting/Out-Paining/标签去除/Pose控制等能力

新模型：

SUS系列模型
Mixtral-MoE系列模型
deepseek系列模型
phi2-3b
cogagent-chat/cogagent-vqa
codegeex2-6b

新数据集:

用于RLHF的数据集：
hh-rlhf
stack-exchange-paired

What's Changed

update multi-line input (infer) by @Jintao-Huang in #196
Fix model saving in new format by @tastelikefeet in #198
Fix compatible error by @tastelikefeet in #201
Fix bug 1206 by @Jintao-Huang in #202
fix fp16 & full bug by @Jintao-Huang in #203
Fix qwen-audio inference bug by @Jintao-Huang in #204
Support multi node by @Jintao-Huang in #205
fix typo bug by @Jintao-Huang in #206
Support sus by @Jintao-Huang in #207
Support cpu by @Jintao-Huang in #208
Add Feat: Freeze Parameters, disable_tqdm by @Jintao-Huang in #210
update dataset by @Jintao-Huang in #212
Support lazy_tokenize, preprocess_num_proc by @Jintao-Huang in #211
Support Mixtral MoE by @tastelikefeet in #217
Add benchmark by @Jintao-Huang in #213
support ui training by @tastelikefeet in #219
Fix transformers 4.36 by @Jintao-Huang in #218
Update mixtral-7b-moe by @Jintao-Huang in #221
Compatible with peft>=0.7.0 by @tastelikefeet in #220
fix dtype='fp16' sft bug by @Jintao-Huang in #227
fix generation_config warning by @Jintao-Huang in #224
Fix merge_lora & model_cache_dir bug by @Jintao-Huang in #229
fix lazy_tokenize bug by @Jintao-Huang in #228
Add inference UI and refactor machenism by @tastelikefeet in #230
Support deepseek by @Jintao-Huang in #223
relax version restriction by @tastelikefeet in #232
fix bug 1218 by @Jintao-Huang in #235
support deployment by @Jintao-Huang in #231
update docs by @Jintao-Huang in #238
Refactor some code by @tastelikefeet in #237
fix typo bug by @Jintao-Huang in #239
update readme & phi2-3b by @Jintao-Huang in #241
Fix argument 1220 by @Jintao-Huang in #242
Support CogAgent by @tastelikefeet in #243
fix infer by @tastelikefeet in #244
Support more peft tuners by @tastelikefeet in #245
Fix copying additional files by @tastelikefeet in #247
Add sft for codegeex2 by @tastelikefeet in #248
fix issue #249 by @tastelikefeet in #250
Feat/scedit by @jiangzeyinzi in #253
Update 1228 by @Jintao-Huang in #254
fix unicode error by @tastelikefeet in #259
Update readme for SCEdit by @tastelikefeet in #258
DPO by @tastelikefeet in #255
update self-cognition by @Jintao-Huang in #261
Fix/1229 by @tastelikefeet in #260
fix trainer init by @tastelikefeet in #262
fix bugs by @tastelikefeet in #263
fix import by @tastelikefeet in #265
Fix import by @tastelikefeet in #266
update perf by @Jintao-Huang in #264
fix bug by @tastelikefeet in #267
Support win32 by @tastelikefeet in #268

Full Changelog: v1.4.0...v1.5.0

Contributors

jiangzeyinzi, Jintao-Huang, and tastelikefeet

Assets 2

08 Dec 03:09

Jintao-Huang

v1.4.0

5018893

v1.4.0

English Version

New features:

Support for self-awareness fine-tuning.
Support for fine-tuning and inference of the AnimateDiff model in the AIGC direction.
Support for flash attention in more models: qwen series, qwen-vl series, llama series, openbuddy series, mistral series, yi series, ziya series, using the use_flash_attn parameter.
Support for multiple loras to take effect simultaneously.

New tuners:

NEFTune
ROME supports more models: chatglm

New models:

AnimateDiff
zephyr-7b-beta-chat, openbuddy-zephyr-7b-chat
qwen-1_8b, qwen-1_8b-chat, qwen-1_8b-chat-int4, qwen-1_8b-chat-int8
qwen-72b, qwen-72b-chat, qwen-72b-chat-int4, qwen-72b-chat-int8
qwen-audio, qwen-audio-chat
yi-34b-chat, codefuse-codellama-34b-chat
tongyi-finance-14b, tongyi-finance-14b-chat, tongyi-finance-14b-chat-int4
bluelm-7b, bluelm-7b-chat, bluelm-7b-32k, bluelm-7b-chat-32k

New datasets:

hc3-zh, hc3-en
codefuse-python-en, codefuse-eval-instruction-zh
aishell1-zh, aishell1-mini-zh

中文版

新特性:

支持自我认知微调.
支持AIGC方向的AnimateDiff模型的微调与推理.
支持更多模型的flash attention: qwen series, qwen-vl series, llama series, openbuddy series, mistral series, yi series, ziya series. 使用use_flash_attn参数.
支持多个lora同时生效

新tuners:

NEFTune
ROME支持更多模型: chatglm

新模型:

AnimateDiff
zephyr-7b-beta-chat, openbuddy-zephyr-7b-chat
qwen-1_8b, qwen-1_8b-chat, qwen-1_8b-chat-int4, qwen-1_8b-chat-int8
qwen-72b, qwen-72b-chat, qwen-72b-chat-int4, qwen-72b-chat-int8
qwen-audio, qwen-audio-chat
yi-34b-chat, codefuse-codellama-34b-chat
tongyi-finance-14b, tongyi-finance-14b-chat, tongyi-finance-14b-chat-int4
bluelm-7b, bluelm-7b-chat, bluelm-7b-32k, bluelm-7b-chat-32k

新数据集:

hc3-zh, hc3-en
codefuse-python-en, codefuse-eval-instruction-zh
aishell1-zh, aishell1-mini-zh

What's Changed

Support Yi-6b sft by @tastelikefeet in #134
fix CLI by @tastelikefeet in #135
update readme by @tastelikefeet in #137
Support xverse 65b sft by @tastelikefeet in #138
Support bluelm by @Jintao-Huang in #140
fix doc by @tastelikefeet in #143
Add neftune by @tastelikefeet in #145
Update sh by @Jintao-Huang in #144
Add compatibility test and fix some problems with peft>=0.6.0 by @tastelikefeet in #146
fix compatible with transformers>=4.35 by @Jintao-Huang in #148
Update sh 1115 by @Jintao-Huang in #150
Update doc by @tastelikefeet in #151
support flash_attn by @Jintao-Huang in #152
Fix bug: not work on peft<=0.5.0 by @tastelikefeet in #155
fix register model bug by @Jintao-Huang in #154
Support tongyi finance 14b by @Jintao-Huang in #157
add check_model args and fix check_dataset by @Jintao-Huang in #159
fix load_from_ckpt_dir bug by @Jintao-Huang in #161
Update arguments by @Jintao-Huang in #162
new feature: save_infer_result_to_jsonl by @Jintao-Huang in #163
Feat 1121 by @Jintao-Huang in #165
update readme and fix bug by @Jintao-Huang in #167
Add cli merge lora by @Jintao-Huang in #168
update code by @Jintao-Huang in #169
support yi-34b-chat by @Jintao-Huang in #164
Add animate diff by @tastelikefeet in #174
update readme by @Jintao-Huang in #175
Refine LoRA to peft by @tastelikefeet in #176
support qwem-72b qwen-1_8b qwen-audio by @Jintao-Huang in #180
Update wechat by @Jintao-Huang in #186
Fix the slow inference speed bug in qwen AutoGPTQ by @Jintao-Huang in #187
Support self cognition by @Jintao-Huang in #188
update dataset model by @Jintao-Huang in #190

Full Changelog: v1.3.0...v1.4.0

Contributors

Jintao-Huang and tastelikefeet

Assets 2

09 Nov 03:55

tastelikefeet

v1.3.0

c7b9651

v1.3.0 Release

English Version

New Features:

Serving supported: LoRA and full-parameter training models are supported in vllm/chatglm.cpp/xinference deployment, check the documentation for details by make docs or docs/source/GetStarted/Deployment.md file.
Support training and inference with CLI and inference with Web-UI.

New Adapters:

QALoRA
Long-LoRA
ROME

New Models:

xverse-65b
yi-6b
ziya2-13b
ziya2-13b-chat
mistral-7b
openbuddy-mistral-7b-chat
mistral-7b-chat
chatglm3-6b-base
chatglm3-6b
chatglm3-6b-32k

New Quantized Models:

qwen-7b-chat-int4
qwen-14b-chat-int4
qwen-vl-chat-int4
baichuan2-7b-chat-int4
baichuan2-13b-chat-int4
qwen-7b-chat-int8
qwen-14b-chat-int8

中文版
新功能:

支持部署：全参数训练及LoRA训练支持以vllm/chatglm.cpp/xinference方式进行部署，可以通过make docs生成官方文档或查看docs/source/GetStarted/Deployment.md文件
支持CLI方式运行训练和推理，同时支持以Web-UI方式运行推理

新的Adapters：

QALoRA
Long-LoRA
ROME

支持训练和推理的新模型:

xverse-65b
yi-6b
ziya2-13b
ziya2-13b-chat
mistral-7b
openbuddy-mistral-7b-chat
mistral-7b-chat
chatglm3-6b-base
chatglm3-6b
chatglm3-6b-32k

支持训练和推理的新量化模型:

qwen-7b-chat-int4
qwen-14b-chat-int4
qwen-vl-chat-int4
baichuan2-7b-chat-int4
baichuan2-13b-chat-int4
qwen-7b-chat-int8
qwen-14b-chat-int8

Feature Commits

add lint script by @tastelikefeet in #94
add document by @Jintao-Huang in #103
Update framework.txt by @zzclynn in #105
Feat/deepspeed by @Jintao-Huang in #39
update sh by @Jintao-Huang in #106
Add baichuan2 13b sh by @Jintao-Huang in #108
Support mistral 7b by @Jintao-Huang in #112
Support int4 by @Jintao-Huang in #116
Support qwen int8 by @Jintao-Huang in #117
support qa_lora by @tastelikefeet in #104
Add longlora for llama by @tastelikefeet in #115
Support ROME by @tastelikefeet in #121
Feat 1018 by @Jintao-Huang in #119
Add script for ROME by @tastelikefeet in #123
Update doc by @tastelikefeet in #125
Feat 1028 by @Jintao-Huang in #122
update web ui and swift cli by @Jintao-Huang in #126
ResTuning readme by @jiangzeyinzi in #129
Update doc by @tastelikefeet in #131

Bug Fix:

Fix qwen bug by @Jintao-Huang in #98
fix ci by @tastelikefeet in #109
fix resume from checkpointing bug by @Jintao-Huang in #110
fix openbuddy template by @Jintao-Huang in #113
update ziya2 by @Jintao-Huang in #114
Fix bug in ROME by @tastelikefeet in #128
fix rome by @tastelikefeet in #133

New Contributors

@zzclynn made their first contribution in #105

Full Changelog: v1.2.0...v1.3.0

Contributors

zzhangpurdue, jiangzeyinzi, and 2 other contributors

Assets 2

22 Sep 06:06

tastelikefeet

v1.1.1

f82100d

v1.1.1 release

Features:

Add make docs command to build docs
Add notebook examples for stable diffusion model
Fix some bugs

Assets 2

15 Sep 06:58

wenmengzhou

v1.1.0

077e310

v1.1.0 Pre-release

Pre-release

v1.1.0

What's Changed

Features

Improvements

Fixes

New Contributors

@yingdachen made their first contribution in PR #2
@tastelikefeet made their first contribution in PR #3
@Jintao-Huang made their first contribution in PR #7
@jiangzeyinzi made their first contribution in PR #38
@weedwardzhao1 made their first contribution in PR #71

Full Changelog: https://github.com/modelscope/swift/commits/v1.1.0

Assets 2

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

What's Changed

Contributors

English version

New Features

新feature

What's Changed

Contributors

English Version

中文版

What's Changed

Contributors

English Version

中文版

What's Changed

Contributors

Feature Commits

Bug Fix:

New Contributors

Contributors

v1.1.0

What's Changed

Features

Improvements

Fixes

New Contributors

Releases: modelscope/ms-swift

v1.5.2

What's Changed

Contributors

v1.5.1

English version

New Features

新feature

What's Changed

Contributors

v1.5.0

English Version

中文版

What's Changed

Contributors

v1.4.0

English Version

中文版

What's Changed

Contributors

v1.3.0 Release

Feature Commits

Bug Fix:

New Contributors

Contributors

v1.1.1 release

v1.1.0

v1.1.0

What's Changed

Features

Improvements

Fixes

New Contributors