Commits · Dovakiins/qwerrwe

optimize dataloading to use cache, fix model token embedding sizes

aa3c3f9

winglian commited on May 12, 2023

Merge branch 'main' into patch-2

89b7f26
unverified

Nanobit commited on May 11, 2023

black formatting

2bc1a5b

winglian commited on May 10, 2023

various fixes

7a490a4

winglian commited on May 10, 2023

Fix Trainer() got multiple values for keyword argument 'callbacks'

813aab3
unverified

Nanobit commited on May 10, 2023

testing mpt triton

e2e68c3

winglian commited on May 10, 2023

fix conditional so alpaca doesn't choke

a27d594

winglian commited on May 10, 2023

Rename variable to use same convention

174b74d

Nanobit commited on May 8, 2023

Add CompletionPrompt type

cf68153

Nanobit commited on May 8, 2023

Merge pull request #21 from NanoCode012/patch-1

bd3c5a5
unverified

winglian commited on May 8, 2023

Merge pull request #19 from NanoCode012/feat/callback-save-lora

bcbc99e
unverified

winglian commited on May 8, 2023

Update trainer.py

36aaea0
unverified

Nanobit commited on May 8, 2023

Fix condition scheduler

5b6690a
unverified

Nanobit commited on May 8, 2023

add support for trust_remote_code for mpt models

a125693

winglian commited on May 8, 2023

Add callbacks to Trainer

cc77bab

Nanobit commited on May 8, 2023

Add callback save peft_model on_save

0d6708b

Nanobit commited on May 8, 2023

Jeopardy bot! (#17)

a12fb0a
unverified

winglian commited on May 8, 2023

fix #16 load best model setting when using 8bit

a4329b1

winglian commited on May 7, 2023

use micro batch size for eval size if not specified

550502b

winglian commited on May 7, 2023

refactor inference, warn if model is frozen

247825b

winglian commited on May 7, 2023

Merge pull request #13 from winglian/dev

cb9a887
unverified

winglian commited on May 7, 2023

Add eval_batch_size for evaluation

0e74b64

Nanobit commited on May 6, 2023

fix log sweep lr

a10a826

winglian commited on May 3, 2023

support for multi line inference input, log sweep over learning rates

9105935

winglian commited on May 3, 2023

fix adam bnb optimizer grouped parameters, fix peft model 8bit conversion logic, black formatting

7748f3d

winglian commited on May 1, 2023

support llama-adapter zero init attention

2255bb7

winglian commited on May 1, 2023

fdsp config dict fix, todo list, add torchdistx support

ad2b48c

winglian commited on Apr 30, 2023

8bit and deepspeed changes

9190ada

winglian commited on Apr 30, 2023

don't load models in 8bit unless they are using an adapter, also fix tokenizer load in exceptional case

6dfdd2d

winglian commited on Apr 30, 2023

fix fsdp training args

29936bb

winglian commited on Apr 30, 2023

fix for zero value warmup steps

7882181

winglian commited on Apr 30, 2023

fix sharegpt tokenization, refactor tokenization debugging

5159d00

winglian commited on Apr 30, 2023

wire up gradient checkpointing for 4bit

c0f50d9

winglian commited on Apr 29, 2023

fix dataset handling, support galactica

4a17a4c

winglian commited on Apr 24, 2023

tweaks to data loading, 8 bit adam, accelerate and deepspeed

097d367

winglian commited on Apr 22, 2023

shuffle and split dataset after save/load

4f2584f

winglian commited on Apr 20, 2023

fix sharegpt handling from hf, don't worry about loading llama if using earlier transformers release

8d43785

winglian commited on Apr 20, 2023

various bugfixes

94f5e41

winglian commited on Apr 19, 2023

fix bug when model_type not explicitly passed

bb991fd

winglian commited on Apr 19, 2023