Spaces:

Dovakiins
/

qwerrwe

Build error

App Files Files Community

qwerrwe / src /axolotl /utils

Commit History

let transformers handle adamw_bnb_8bit

868530c

tmm1 commited on Aug 26, 2023

ignore: address pr review

d03887f
unverified

Maxime commited on Aug 26, 2023

ignore: linter

a184549
unverified

Maxime commited on Aug 26, 2023

fix: finetune model inference needs the dtype fix to work with flash-attn

f311df9
unverified

Maxime commited on Aug 26, 2023

fix types w lora (#478)

0b7ba57
unverified

winglian commited on Aug 25, 2023

Fix(tokenizer): Fix condition to add pad token (#477)

71bd062
unverified

Nanobit commited on Aug 25, 2023

improve llama pad token handling (#475)

cb9797e
unverified

winglian commited on Aug 24, 2023

ReLoRA implementation (with quantization) (#322)

bde3c5a
unverified

winglian commited on Aug 24, 2023

workaround so training doesn't hang when packed dataloader batches aren't even (#461)

c69faee
unverified

winglian commited on Aug 23, 2023

recast loralayer, norm, lmhead + embed token weights per original qlora (#393)

96deb6b
unverified

winglian commited on Aug 21, 2023

always drop samples that are too long (#452)

50682a3
unverified

winglian commited on Aug 21, 2023

set env var for FSDP layer to wrap (#453)

5a1985b
unverified

winglian commited on Aug 21, 2023

add missing positional arg (#450)

58cf7e7
unverified

winglian commited on Aug 21, 2023

fix evals (#447)

ee26281
unverified

winglian commited on Aug 21, 2023

support user defined prompters, pretokenized datasets in config, local parquet, local arrow files (#348)

d2e7f27
unverified

winglian commited on Aug 20, 2023

disable eval using multipack for now (#437)

f733d0f
unverified

winglian commited on Aug 19, 2023

fix comma, not a tuple (#436)

008505c
unverified

winglian commited on Aug 19, 2023

use save_strategy from config if available (#434)

b3f5e00
unverified

winglian commited on Aug 19, 2023

set env for FSDP offload params (#433)

5247c50
unverified

winglian commited on Aug 19, 2023

standardize attn hijack patches (#381)

06edf17
unverified

winglian commited on Aug 18, 2023

Fix(config): Update handling of deepspeed config (#404)

c01015f
unverified

Nanobit commited on Aug 15, 2023

fix eval steps and strategy (#403)

da10af0
unverified

winglian commited on Aug 15, 2023

add utils.data.prepare_dataset

2e22404

tmm1 commited on Aug 15, 2023

use context manager to run things on rank0 before others (#397)

fc2d6be
unverified

winglian commited on Aug 15, 2023

don't use mask expansion for inference (#392)

1687be6
unverified

winglian commited on Aug 15, 2023

Feat(config): add max steps (#387)

3c2ad00
unverified

ittailup commited on Aug 14, 2023

Added "epoch" evaluation_strategy (#388)

5d48a10
unverified

flotos commited on Aug 14, 2023

Feat(config): Add hub_strategy (#386)

73a0b6e
unverified

Nanobit commited on Aug 14, 2023

don't pass rope_scaling kwarg if it's None (#383)

919246f
unverified

winglian commited on Aug 13, 2023

Fix crash when running without CUDA

15f6e57

chargoddard commited on Aug 13, 2023

try to detect accelerate and only use device_map=None in that case (#373)

094fc2c
unverified

tmm1 commited on Aug 13, 2023

remove unnecessary local variable

0c96727

tmm1 commited on Aug 13, 2023

simplify `load_tokenizer`

efb3b2c

tmm1 commited on Aug 13, 2023

improve GPU logging to break out pytorch cache and system mem

7b55fe6

tmm1 commited on Aug 13, 2023

quiet noise from llama tokenizer by setting pad token earlier

e029ab3

tmm1 commited on Aug 13, 2023

extract module for working with cfg

8cec513

tmm1 commited on Aug 13, 2023

fix DefaultDict.or

a13e45d

tmm1 commited on Aug 10, 2023

Attention mask and position id fixes for packing (#285)

2bb0b78
unverified

winglian commited on Aug 12, 2023

Add wandb_entity to wandb options, update example configs, update README (#361)

7019509
unverified

Morgan McGuire Morgan McGuire

winglian commited on Aug 12, 2023

Fix(model loading): Warn when model revision is passed to gptq (#364)

96bd6ae
unverified

Nanobit commited on Aug 12, 2023

Feat: Add rope scaling (#343)

b521206
unverified

Nanobit commited on Aug 12, 2023

Merge pull request #356 from tmm1/load_model-args

11ddccb
unverified

tmm1 commited on Aug 10, 2023

simplify load_model signature

7181022

tmm1 commited on Aug 9, 2023

log GPU memory usage

e303d64

tmm1 commited on Aug 9, 2023

ensure enable_input_require_grads is called on model before getting the peft model (#345)

176b888
unverified

winglian commited on Aug 6, 2023

experimental llama 2 chat support (#296)

3392270
unverified

Jan Philipp Harries Jan Philipp Harries commited on Aug 6, 2023

optimize the iteration when tokenizeing large datasets (#332)

fe28543
unverified

winglian commited on Aug 4, 2023

fix typo

2eda9e0

tmm1 commited on Aug 3, 2023

scope flash-attn+qlora fix correctly, scope to llama, add comment

78b9efb

tmm1 commited on Aug 3, 2023

move flash-attn monkey patch alongside the others

312a9fa

tmm1 commited on Aug 3, 2023