{
  "best_metric": 4.247443199157715,
  "best_model_checkpoint": "autotrain-psamz-ydtct/checkpoint-27",
  "epoch": 3.0,
  "eval_steps": 500,
  "global_step": 27,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.1111111111111111,
      "grad_norm": NaN,
      "learning_rate": 0.0,
      "loss": 5.8811,
      "step": 1
    },
    {
      "epoch": 0.2222222222222222,
      "grad_norm": NaN,
      "learning_rate": 0.0,
      "loss": 5.6497,
      "step": 2
    },
    {
      "epoch": 0.3333333333333333,
      "grad_norm": 9.8977689743042,
      "learning_rate": 1.6666666666666667e-05,
      "loss": 5.0422,
      "step": 3
    },
    {
      "epoch": 0.4444444444444444,
      "grad_norm": 8.066682815551758,
      "learning_rate": 3.3333333333333335e-05,
      "loss": 5.04,
      "step": 4
    },
    {
      "epoch": 0.5555555555555556,
      "grad_norm": 10.584939002990723,
      "learning_rate": 5e-05,
      "loss": 5.8129,
      "step": 5
    },
    {
      "epoch": 0.6666666666666666,
      "grad_norm": 10.398998260498047,
      "learning_rate": 4.791666666666667e-05,
      "loss": 5.8728,
      "step": 6
    },
    {
      "epoch": 0.7777777777777778,
      "grad_norm": 9.888347625732422,
      "learning_rate": 4.5833333333333334e-05,
      "loss": 5.3564,
      "step": 7
    },
    {
      "epoch": 0.8888888888888888,
      "grad_norm": 9.768207550048828,
      "learning_rate": 4.375e-05,
      "loss": 5.1863,
      "step": 8
    },
    {
      "epoch": 1.0,
      "grad_norm": 8.677140235900879,
      "learning_rate": 4.166666666666667e-05,
      "loss": 4.1443,
      "step": 9
    },
    {
      "epoch": 1.0,
      "eval_gen_len": 17.4,
      "eval_loss": 4.743879318237305,
      "eval_rouge1": 20.3918,
      "eval_rouge2": 7.2222,
      "eval_rougeL": 19.1015,
      "eval_rougeLsum": 19.196,
      "eval_runtime": 0.5828,
      "eval_samples_per_second": 8.579,
      "eval_steps_per_second": 3.432,
      "step": 9
    },
    {
      "epoch": 1.1111111111111112,
      "grad_norm": 5.280820846557617,
      "learning_rate": 3.958333333333333e-05,
      "loss": 5.1779,
      "step": 10
    },
    {
      "epoch": 1.2222222222222223,
      "grad_norm": 7.356754779815674,
      "learning_rate": 3.7500000000000003e-05,
      "loss": 5.3233,
      "step": 11
    },
    {
      "epoch": 1.3333333333333333,
      "grad_norm": 6.382626056671143,
      "learning_rate": 3.541666666666667e-05,
      "loss": 4.3704,
      "step": 12
    },
    {
      "epoch": 1.4444444444444444,
      "grad_norm": 12.941242218017578,
      "learning_rate": 3.3333333333333335e-05,
      "loss": 5.4235,
      "step": 13
    },
    {
      "epoch": 1.5555555555555556,
      "grad_norm": 6.487708568572998,
      "learning_rate": 3.125e-05,
      "loss": 4.971,
      "step": 14
    },
    {
      "epoch": 1.6666666666666665,
      "grad_norm": 11.280416488647461,
      "learning_rate": 2.916666666666667e-05,
      "loss": 4.979,
      "step": 15
    },
    {
      "epoch": 1.7777777777777777,
      "grad_norm": 5.232430934906006,
      "learning_rate": 2.7083333333333332e-05,
      "loss": 4.6216,
      "step": 16
    },
    {
      "epoch": 1.8888888888888888,
      "grad_norm": 7.990512371063232,
      "learning_rate": 2.5e-05,
      "loss": 4.7268,
      "step": 17
    },
    {
      "epoch": 2.0,
      "grad_norm": 10.302239418029785,
      "learning_rate": 2.2916666666666667e-05,
      "loss": 5.6686,
      "step": 18
    },
    {
      "epoch": 2.0,
      "eval_gen_len": 18.2,
      "eval_loss": 4.378715515136719,
      "eval_rouge1": 21.4101,
      "eval_rouge2": 7.094,
      "eval_rougeL": 20.1601,
      "eval_rougeLsum": 20.1601,
      "eval_runtime": 0.5378,
      "eval_samples_per_second": 9.297,
      "eval_steps_per_second": 3.719,
      "step": 18
    },
    {
      "epoch": 2.111111111111111,
      "grad_norm": 5.861759185791016,
      "learning_rate": 2.0833333333333336e-05,
      "loss": 5.2733,
      "step": 19
    },
    {
      "epoch": 2.2222222222222223,
      "grad_norm": 5.337183475494385,
      "learning_rate": 1.8750000000000002e-05,
      "loss": 4.5924,
      "step": 20
    },
    {
      "epoch": 2.3333333333333335,
      "grad_norm": 6.787334442138672,
      "learning_rate": 1.6666666666666667e-05,
      "loss": 4.9199,
      "step": 21
    },
    {
      "epoch": 2.4444444444444446,
      "grad_norm": 8.560152053833008,
      "learning_rate": 1.4583333333333335e-05,
      "loss": 5.0443,
      "step": 22
    },
    {
      "epoch": 2.5555555555555554,
      "grad_norm": 5.71703577041626,
      "learning_rate": 1.25e-05,
      "loss": 4.3159,
      "step": 23
    },
    {
      "epoch": 2.6666666666666665,
      "grad_norm": 9.154146194458008,
      "learning_rate": 1.0416666666666668e-05,
      "loss": 5.1936,
      "step": 24
    },
    {
      "epoch": 2.7777777777777777,
      "grad_norm": 5.609956741333008,
      "learning_rate": 8.333333333333334e-06,
      "loss": 4.1952,
      "step": 25
    },
    {
      "epoch": 2.888888888888889,
      "grad_norm": 4.967115879058838,
      "learning_rate": 6.25e-06,
      "loss": 4.3354,
      "step": 26
    },
    {
      "epoch": 3.0,
      "grad_norm": 10.054126739501953,
      "learning_rate": 4.166666666666667e-06,
      "loss": 5.4746,
      "step": 27
    },
    {
      "epoch": 3.0,
      "eval_gen_len": 18.2,
      "eval_loss": 4.247443199157715,
      "eval_rouge1": 21.4907,
      "eval_rouge2": 7.094,
      "eval_rougeL": 20.2004,
      "eval_rougeLsum": 20.2004,
      "eval_runtime": 0.5355,
      "eval_samples_per_second": 9.336,
      "eval_steps_per_second": 3.735,
      "step": 27
    }
  ],
  "logging_steps": 1,
  "max_steps": 27,
  "num_input_tokens_seen": 0,
  "num_train_epochs": 3,
  "save_steps": 500,
  "stateful_callbacks": {
    "EarlyStoppingCallback": {
      "args": {
        "early_stopping_patience": 5,
        "early_stopping_threshold": 0.01
      },
      "attributes": {
        "early_stopping_patience_counter": 0
      }
    },
    "TrainerControl": {
      "args": {
        "should_epoch_stop": false,
        "should_evaluate": false,
        "should_log": false,
        "should_save": true,
        "should_training_stop": true
      },
      "attributes": {}
    }
  },
  "total_flos": 1725607968768.0,
  "train_batch_size": 2,
  "trial_name": null,
  "trial_params": null
}