Model save

Browse files

Files changed (11) hide show

README.md +6 -16
all_results.json +5 -5
config.json +1 -1
model-00001-of-00004.safetensors +1 -1
model-00002-of-00004.safetensors +1 -1
model-00003-of-00004.safetensors +1 -1
model-00004-of-00004.safetensors +1 -1
tokenizer_config.json +2 -0
train_results.json +5 -5
trainer_state.json +43 -238
training_args.bin +2 -2

README.md CHANGED Viewed

@@ -2,12 +2,10 @@
 license: cc-by-nc-4.0
 base_model: sfairXC/FsfairX-LLaMA3-RM-v0.1
 tags:
-- easylm
 - trl
 - reward-trainer
 - generated_from_trainer
-metrics:
-- accuracy
 model-index:
 - name: easylm-helpsteer-rm-FsfairX-LLaMA3-RM-v0.1
   results: []
@@ -19,9 +17,6 @@ should probably proofread and complete it, then remove this comment. -->
 # easylm-helpsteer-rm-FsfairX-LLaMA3-RM-v0.1
 This model is a fine-tuned version of [sfairXC/FsfairX-LLaMA3-RM-v0.1](https://huggingface.co/sfairXC/FsfairX-LLaMA3-RM-v0.1) on an unknown dataset.
-It achieves the following results on the evaluation set:
-- Loss: 0.4821
-- Accuracy: 0.7784
 ## Model description
@@ -40,30 +35,25 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 1e-06
 - train_batch_size: 1
 - eval_batch_size: 1
 - seed: 42
 - distributed_type: multi-GPU
-- num_devices: 4
-- total_train_batch_size: 4
-- total_eval_batch_size: 4
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - num_epochs: 1
 ### Training results
-| Training Loss | Epoch  | Step | Validation Loss | Accuracy |
-|:-------------:|:------:|:----:|:---------------:|:--------:|
-| 0.5465        | 0.3053 | 500  | 0.5170          | 0.7755   |
-| 0.6788        | 0.6105 | 1000 | 0.4570          | 0.8105   |
-| 0.5754        | 0.9158 | 1500 | 0.4829          | 0.7872   |
 ### Framework versions
 - Transformers 4.43.3
-- Pytorch 2.3.0+cu121
 - Datasets 2.20.0
 - Tokenizers 0.19.1

 license: cc-by-nc-4.0
 base_model: sfairXC/FsfairX-LLaMA3-RM-v0.1
 tags:
 - trl
 - reward-trainer
+- easylm
 - generated_from_trainer
 model-index:
 - name: easylm-helpsteer-rm-FsfairX-LLaMA3-RM-v0.1
   results: []
 # easylm-helpsteer-rm-FsfairX-LLaMA3-RM-v0.1
 This model is a fine-tuned version of [sfairXC/FsfairX-LLaMA3-RM-v0.1](https://huggingface.co/sfairXC/FsfairX-LLaMA3-RM-v0.1) on an unknown dataset.
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 2e-05
 - train_batch_size: 1
 - eval_batch_size: 1
 - seed: 42
 - distributed_type: multi-GPU
+- num_devices: 8
+- total_train_batch_size: 8
+- total_eval_batch_size: 8
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - num_epochs: 1
 ### Training results
 ### Framework versions
 - Transformers 4.43.3
+- Pytorch 2.4.0+cu121
 - Datasets 2.20.0
 - Tokenizers 0.19.1

all_results.json CHANGED Viewed

@@ -7,9 +7,9 @@
     "eval_samples_per_second": 8.749,
     "eval_steps_per_second": 2.194,
     "total_flos": 0.0,
-    "train_loss": 0.5596484089945699,
-    "train_runtime": 4783.2861,
-    "train_samples": 6981,
-    "train_samples_per_second": 1.369,
-    "train_steps_per_second": 0.342
 }

     "eval_samples_per_second": 8.749,
     "eval_steps_per_second": 2.194,
     "total_flos": 0.0,
+    "train_loss": 0.6827200654027559,
+    "train_runtime": 753.5592,
+    "train_samples": 6666,
+    "train_samples_per_second": 8.846,
+    "train_steps_per_second": 1.107
 }

config.json CHANGED Viewed

@@ -31,6 +31,6 @@
   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
   "transformers_version": "4.43.3",
-  "use_cache": true,
   "vocab_size": 128257
 }

   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
   "transformers_version": "4.43.3",
+  "use_cache": false,
   "vocab_size": 128257
 }

model-00001-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b34ffd54b3d4f05d88eb4812c9352a8abce9efa749a5c48c6d8143b7013448d8
 size 4976706864

 version https://git-lfs.github.com/spec/v1
+oid sha256:8acc17427f8f0dd8c1f1f528cf530b2d66f161b5911af5b8d36a2138fca1c667
 size 4976706864

model-00002-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6e87c01447f917408327e8aa4a94c97a2e7aca8924f55f12d69c6c6c3d48d0bc
 size 4999802720

 version https://git-lfs.github.com/spec/v1
+oid sha256:cf18e01eb67a8e667dbe1c250eaddc16759f6e53f6c2ce59442fcf923204a156
 size 4999802720

model-00003-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3b6882c3999b90fdc8d41a337b6c35224af0d347a818a87bc3f52b31e916b1a1
 size 4915916176

 version https://git-lfs.github.com/spec/v1
+oid sha256:fafe4d838dbd806b0a060badc69971b47e1b16f02ba269d0ca71421fd6f78dbe
 size 4915916176

model-00004-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:264a63f89a5aeef6a33137a0f6080313ff2ec594f18f3b0bb495eaab43ea99c0
 size 117473824

 version https://git-lfs.github.com/spec/v1
+oid sha256:13cadc396a9ccebc408bad24f9762ca2e3d012d0bb83b69eaa3e43b7b0ca42cf
 size 117473824

tokenizer_config.json CHANGED Viewed

@@ -1,4 +1,5 @@
 {
   "added_tokens_decoder": {
     "128000": {
       "content": "<|begin_of_text|>",
@@ -2067,5 +2068,6 @@
   ],
   "model_max_length": 4096,
   "pad_token": "[PAD]",
   "tokenizer_class": "PreTrainedTokenizerFast"
 }

 {
+  "add_eos_token": true,
   "added_tokens_decoder": {
     "128000": {
       "content": "<|begin_of_text|>",
   ],
   "model_max_length": 4096,
   "pad_token": "[PAD]",
+  "padding_side": "right",
   "tokenizer_class": "PreTrainedTokenizerFast"
 }

train_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 1.0,
     "total_flos": 0.0,
-    "train_loss": 0.5596484089945699,
-    "train_runtime": 4783.2861,
-    "train_samples": 6981,
-    "train_samples_per_second": 1.369,
-    "train_steps_per_second": 0.342
 }

 {
     "epoch": 1.0,
     "total_flos": 0.0,
+    "train_loss": 0.6827200654027559,
+    "train_runtime": 753.5592,
+    "train_samples": 6666,
+    "train_samples_per_second": 8.846,
+    "train_steps_per_second": 1.107
 }

trainer_state.json CHANGED Viewed

@@ -2,275 +2,80 @@
   "best_metric": null,
   "best_model_checkpoint": null,
   "epoch": 1.0,
-  "eval_steps": 500,
-  "global_step": 1638,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.030525030525030524,
-      "grad_norm": 62.938530852833836,
-      "learning_rate": 9.977026925653056e-07,
-      "loss": 0.5083,
-      "step": 50
-    },
-    {
-      "epoch": 0.06105006105006105,
-      "grad_norm": 213.3598267649049,
-      "learning_rate": 9.908318807470199e-07,
-      "loss": 0.5674,
       "step": 100
     },
     {
-      "epoch": 0.09157509157509157,
-      "grad_norm": 154.79969789365293,
-      "learning_rate": 9.794507020134337e-07,
-      "loss": 0.54,
-      "step": 150
-    },
-    {
-      "epoch": 0.1221001221001221,
-      "grad_norm": 46.601082604459464,
-      "learning_rate": 9.636637406306276e-07,
-      "loss": 0.626,
       "step": 200
     },
     {
-      "epoch": 0.15262515262515264,
-      "grad_norm": 53.962192059634134,
-      "learning_rate": 9.436160666136257e-07,
-      "loss": 0.5212,
-      "step": 250
-    },
-    {
-      "epoch": 0.18315018315018314,
-      "grad_norm": 87.58560621983881,
-      "learning_rate": 9.194919026446978e-07,
-      "loss": 0.5516,
       "step": 300
     },
     {
-      "epoch": 0.21367521367521367,
-      "grad_norm": 123.80979482151284,
-      "learning_rate": 8.915129312088112e-07,
-      "loss": 0.6218,
-      "step": 350
-    },
-    {
-      "epoch": 0.2442002442002442,
-      "grad_norm": 390.7971062188635,
-      "learning_rate": 8.599362575023441e-07,
-      "loss": 0.6515,
       "step": 400
     },
     {
-      "epoch": 0.27472527472527475,
-      "grad_norm": 26.658076048563824,
-      "learning_rate": 8.25052046834372e-07,
-      "loss": 0.5756,
-      "step": 450
-    },
-    {
-      "epoch": 0.3052503052503053,
-      "grad_norm": 57.30779689782776,
-      "learning_rate": 7.87180858230979e-07,
-      "loss": 0.5465,
       "step": 500
     },
     {
-      "epoch": 0.3052503052503053,
-      "eval_accuracy": 0.7755102040816326,
-      "eval_loss": 0.5169934034347534,
-      "eval_runtime": 38.1975,
-      "eval_samples_per_second": 8.98,
-      "eval_steps_per_second": 2.251,
-      "step": 500
-    },
-    {
-      "epoch": 0.33577533577533575,
-      "grad_norm": 0.3421131228542828,
-      "learning_rate": 7.466706987447221e-07,
-      "loss": 0.573,
-      "step": 550
-    },
-    {
-      "epoch": 0.3663003663003663,
-      "grad_norm": 322.32829569797076,
-      "learning_rate": 7.03893825537875e-07,
-      "loss": 0.5859,
       "step": 600
     },
     {
-      "epoch": 0.3968253968253968,
-      "grad_norm": 70.58010836437558,
-      "learning_rate": 6.592433251258422e-07,
-      "loss": 0.6098,
-      "step": 650
-    },
-    {
-      "epoch": 0.42735042735042733,
-      "grad_norm": 46.90754337155108,
-      "learning_rate": 6.131295012148612e-07,
-      "loss": 0.5937,
       "step": 700
     },
     {
-      "epoch": 0.45787545787545786,
-      "grad_norm": 33.718249054223485,
-      "learning_rate": 5.659761043269833e-07,
-      "loss": 0.6069,
-      "step": 750
-    },
-    {
-      "epoch": 0.4884004884004884,
-      "grad_norm": 67.18852674620265,
-      "learning_rate": 5.182164378591751e-07,
-      "loss": 0.5216,
       "step": 800
     },
-    {
-      "epoch": 0.518925518925519,
-      "grad_norm": 63.20860748452122,
-      "learning_rate": 4.7028937635885676e-07,
-      "loss": 0.5404,
-      "step": 850
-    },
-    {
-      "epoch": 0.5494505494505495,
-      "grad_norm": 101.12697436330178,
-      "learning_rate": 4.226353326048593e-07,
-      "loss": 0.6039,
-      "step": 900
-    },
-    {
-      "epoch": 0.57997557997558,
-      "grad_norm": 16.22019917375954,
-      "learning_rate": 3.7569221055322e-07,
-      "loss": 0.4532,
-      "step": 950
-    },
-    {
-      "epoch": 0.6105006105006106,
-      "grad_norm": 60.84282514547736,
-      "learning_rate": 3.298913813371268e-07,
-      "loss": 0.6788,
-      "step": 1000
-    },
-    {
-      "epoch": 0.6105006105006106,
-      "eval_accuracy": 0.8104956268221575,
-      "eval_loss": 0.45700323581695557,
-      "eval_runtime": 39.2826,
-      "eval_samples_per_second": 8.732,
-      "eval_steps_per_second": 2.189,
-      "step": 1000
-    },
-    {
-      "epoch": 0.6410256410256411,
-      "grad_norm": 27.664920029800854,
-      "learning_rate": 2.856537192984728e-07,
-      "loss": 0.498,
-      "step": 1050
-    },
-    {
-      "epoch": 0.6715506715506715,
-      "grad_norm": 39.65159769933289,
-      "learning_rate": 2.4338573447683793e-07,
-      "loss": 0.4883,
-      "step": 1100
-    },
-    {
-      "epoch": 0.702075702075702,
-      "grad_norm": 122.2483315006908,
-      "learning_rate": 2.034758370953431e-07,
-      "loss": 0.4834,
-      "step": 1150
-    },
-    {
-      "epoch": 0.7326007326007326,
-      "grad_norm": 77.76945449705711,
-      "learning_rate": 1.6629076836987782e-07,
-      "loss": 0.6567,
-      "step": 1200
-    },
-    {
-      "epoch": 0.7631257631257631,
-      "grad_norm": 294.4900200191884,
-      "learning_rate": 1.3217223043981295e-07,
-      "loss": 0.5157,
-      "step": 1250
-    },
-    {
-      "epoch": 0.7936507936507936,
-      "grad_norm": 148.80279171380104,
-      "learning_rate": 1.0143374638853891e-07,
-      "loss": 0.5137,
-      "step": 1300
-    },
-    {
-      "epoch": 0.8241758241758241,
-      "grad_norm": 196.55030736251504,
-      "learning_rate": 7.435777920782443e-08,
-      "loss": 0.5831,
-      "step": 1350
-    },
-    {
-      "epoch": 0.8547008547008547,
-      "grad_norm": 16.26079979378068,
-      "learning_rate": 5.119313618049309e-08,
-      "loss": 0.5032,
-      "step": 1400
-    },
-    {
-      "epoch": 0.8852258852258852,
-      "grad_norm": 56.51782762296821,
-      "learning_rate": 3.2152682533139466e-08,
-      "loss": 0.5128,
-      "step": 1450
-    },
-    {
-      "epoch": 0.9157509157509157,
-      "grad_norm": 21.457330627788103,
-      "learning_rate": 1.7411385368659936e-08,
-      "loss": 0.5754,
-      "step": 1500
-    },
-    {
-      "epoch": 0.9157509157509157,
-      "eval_accuracy": 0.7871720116618076,
-      "eval_loss": 0.48293355107307434,
-      "eval_runtime": 38.5213,
-      "eval_samples_per_second": 8.904,
-      "eval_steps_per_second": 2.233,
-      "step": 1500
-    },
-    {
-      "epoch": 0.9462759462759462,
-      "grad_norm": 102.68064209299165,
-      "learning_rate": 7.104705853346271e-09,
-      "loss": 0.5787,
-      "step": 1550
-    },
-    {
-      "epoch": 0.9768009768009768,
-      "grad_norm": 13.53505025487251,
-      "learning_rate": 1.3273544331087737e-09,
-      "loss": 0.5539,
-      "step": 1600
-    },
     {
       "epoch": 1.0,
-      "step": 1638,
       "total_flos": 0.0,
-      "train_loss": 0.5596484089945699,
-      "train_runtime": 4783.2861,
-      "train_samples_per_second": 1.369,
-      "train_steps_per_second": 0.342
     }
   ],
-  "logging_steps": 50,
-  "max_steps": 1638,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 1,
   "save_steps": 500,
@@ -280,8 +85,8 @@
         "should_epoch_stop": false,
         "should_evaluate": false,
         "should_log": false,
-        "should_save": true,
-        "should_training_stop": true
       },
       "attributes": {}
     }

   "best_metric": null,
   "best_model_checkpoint": null,
   "epoch": 1.0,
+  "eval_steps": 1000,
+  "global_step": 834,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.11990407673860912,
+      "grad_norm": 2.294161319732666,
+      "learning_rate": 1.929887378670186e-05,
+      "loss": 0.7381,
       "step": 100
     },
     {
+      "epoch": 0.23980815347721823,
+      "grad_norm": 2.2879245281219482,
+      "learning_rate": 1.729381074020218e-05,
+      "loss": 0.6867,
       "step": 200
     },
     {
+      "epoch": 0.3597122302158273,
+      "grad_norm": 4.782385349273682,
+      "learning_rate": 1.4265971312744252e-05,
+      "loss": 0.6877,
       "step": 300
     },
     {
+      "epoch": 0.47961630695443647,
+      "grad_norm": 4.921843528747559,
+      "learning_rate": 1.0639935022777741e-05,
+      "loss": 0.6793,
       "step": 400
     },
     {
+      "epoch": 0.5995203836930456,
+      "grad_norm": 3.5888805389404297,
+      "learning_rate": 6.924163688955825e-06,
+      "loss": 0.6807,
       "step": 500
     },
     {
+      "epoch": 0.7194244604316546,
+      "grad_norm": 4.4004926681518555,
+      "learning_rate": 3.6397022482313804e-06,
+      "loss": 0.6611,
       "step": 600
     },
     {
+      "epoch": 0.8393285371702638,
+      "grad_norm": 7.610467910766602,
+      "learning_rate": 1.2471151031361795e-06,
+      "loss": 0.651,
       "step": 700
     },
     {
+      "epoch": 0.9592326139088729,
+      "grad_norm": 12.039061546325684,
+      "learning_rate": 8.190336667550869e-08,
+      "loss": 0.6708,
       "step": 800
     },
     {
       "epoch": 1.0,
+      "step": 834,
       "total_flos": 0.0,
+      "train_loss": 0.6827200654027559,
+      "train_runtime": 753.5592,
+      "train_samples_per_second": 8.846,
+      "train_steps_per_second": 1.107
     }
   ],
+  "logging_steps": 100,
+  "max_steps": 834,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 1,
   "save_steps": 500,
         "should_epoch_stop": false,
         "should_evaluate": false,
         "should_log": false,
+        "should_save": false,
+        "should_training_stop": false
       },
       "attributes": {}
     }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4608cf40f4c0de185f58bcdfe2c60989c03b08df7e180272c46735b16be89923
-size 6392

 version https://git-lfs.github.com/spec/v1
+oid sha256:9e7f7ddef7114b0f7e591d962ab6cae24ccd95a2ad6cb3e4dfd866dc0ef76178
+size 6264