PathFinderKR commited on
Commit
f1fc06e
1 Parent(s): 5bfbd92

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +5 -5
README.md CHANGED
@@ -172,9 +172,9 @@ bnb_4bit_use_double_quant=True
172
  ################################################################################
173
  task_type="CAUSAL_LM"
174
  target_modules=["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"]
175
- r=16
176
- lora_alpha=32
177
- lora_dropout=0.1
178
  bias="none"
179
 
180
  ################################################################################
@@ -193,7 +193,7 @@ weight_decay=0.01
193
  ################################################################################
194
  # SFT parameters
195
  ################################################################################
196
- max_seq_length=2048
197
  packing=False
198
  ```
199
 
@@ -276,7 +276,7 @@ packing=False
276
 
277
  ### Training Details
278
 
279
- - **Training time:** 18 hours
280
  - More details on [Weights & Biases](https://wandb.ai/pathfinderkr/Waktaverse-Llama-3-KO-8B-Instruct?nw=nwuserpathfinderkr)
281
 
282
 
 
172
  ################################################################################
173
  task_type="CAUSAL_LM"
174
  target_modules=["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"]
175
+ r=8
176
+ lora_alpha=16
177
+ lora_dropout=0.05
178
  bias="none"
179
 
180
  ################################################################################
 
193
  ################################################################################
194
  # SFT parameters
195
  ################################################################################
196
+ max_seq_length=4096
197
  packing=False
198
  ```
199
 
 
276
 
277
  ### Training Details
278
 
279
+ - **Training time:** 80 hours
280
  - More details on [Weights & Biases](https://wandb.ai/pathfinderkr/Waktaverse-Llama-3-KO-8B-Instruct?nw=nwuserpathfinderkr)
281
 
282