Spaces:

Dovakiins
/

qwerrwe

Build error

Nanobit commited on Jul 14, 2023

Commit

231031a

•

2 Parent(s): 5daf7d5 5491278

Merge pull request #275 from NanoCode012/feat/safetensors

Files changed (2) hide show

README.md CHANGED Viewed

@@ -413,6 +413,9 @@ logging_steps:
 save_steps:
 eval_steps:
 # whether to mask out or include the human's prompt from the training labels
 train_on_inputs: false
 # don't use this, leads to wonky training (according to someone on the internet)

 save_steps:
 eval_steps:
+# save model as safetensors (require safetensors package)
+save_safetensors:
 # whether to mask out or include the human's prompt from the training labels
 train_on_inputs: false
 # don't use this, leads to wonky training (according to someone on the internet)

src/axolotl/utils/trainer.py CHANGED Viewed

@@ -182,6 +182,9 @@ def setup_trainer(cfg, train_dataset, eval_dataset, model, tokenizer):
         training_arguments_kwargs["hub_model_id"] = cfg.hub_model_id
         training_arguments_kwargs["push_to_hub"] = True
     training_args = AxolotlTrainingArguments(
         per_device_train_batch_size=cfg.micro_batch_size,
         per_device_eval_batch_size=cfg.eval_batch_size

         training_arguments_kwargs["hub_model_id"] = cfg.hub_model_id
         training_arguments_kwargs["push_to_hub"] = True
+    if cfg.save_safetensors:
+        training_arguments_kwargs["save_safetensors"] = cfg.save_safetensors
     training_args = AxolotlTrainingArguments(
         per_device_train_batch_size=cfg.micro_batch_size,
         per_device_eval_batch_size=cfg.eval_batch_size