Spaces:

Dovakiins
/

qwerrwe

Build error

App Files Files Community

qwerrwe / tests /e2e /test_lora_llama.py

winglian

misc fixes to add gptq tests (#621)

03e5907 unverified 12 months ago

raw

history blame

No virus

5.57 kB

	"""
	E2E tests for lora llama
	"""

	import logging
	import os
	import tempfile
	import unittest
	from pathlib import Path

	from axolotl.cli import load_datasets
	from axolotl.common.cli import TrainerCliArgs
	from axolotl.train import train
	from axolotl.utils.config import normalize_config
	from axolotl.utils.dict import DictDefault

	LOG = logging.getLogger("axolotl.tests.e2e")
	os.environ["WANDB_DISABLED"] = "true"


	class TestLoraLlama(unittest.TestCase):
	"""
	Test case for Llama models using LoRA
	"""

	def test_lora(self):
	# pylint: disable=duplicate-code
	output_dir = tempfile.mkdtemp()
	cfg = DictDefault(
	{
	"base_model": "JackFram/llama-68m",
	"base_model_config": "JackFram/llama-68m",
	"tokenizer_type": "LlamaTokenizer",
	"sequence_len": 1024,
	"load_in_8bit": True,
	"adapter": "lora",
	"lora_r": 32,
	"lora_alpha": 64,
	"lora_dropout": 0.05,
	"lora_target_linear": True,
	"val_set_size": 0.1,
	"special_tokens": {
	"unk_token": "<unk>",
	"bos_token": "<s>",
	"eos_token": "</s>",
	},
	"datasets": [
	{
	"path": "mhenrichsen/alpaca_2k_test",
	"type": "alpaca",
	},
	],
	"num_epochs": 2,
	"micro_batch_size": 8,
	"gradient_accumulation_steps": 1,
	"output_dir": output_dir,
	"learning_rate": 0.00001,
	"optimizer": "adamw_torch",
	"lr_scheduler": "cosine",
	}
	)
	normalize_config(cfg)
	cli_args = TrainerCliArgs()
	dataset_meta = load_datasets(cfg=cfg, cli_args=cli_args)

	train(cfg=cfg, cli_args=cli_args, dataset_meta=dataset_meta)
	assert (Path(output_dir) / "adapter_model.bin").exists()

	def test_lora_packing(self):
	# pylint: disable=duplicate-code
	output_dir = tempfile.mkdtemp()
	cfg = DictDefault(
	{
	"base_model": "JackFram/llama-68m",
	"base_model_config": "JackFram/llama-68m",
	"tokenizer_type": "LlamaTokenizer",
	"sequence_len": 1024,
	"sample_packing": True,
	"flash_attention": True,
	"load_in_8bit": True,
	"adapter": "lora",
	"lora_r": 32,
	"lora_alpha": 64,
	"lora_dropout": 0.05,
	"lora_target_linear": True,
	"val_set_size": 0.1,
	"special_tokens": {
	"unk_token": "<unk>",
	"bos_token": "<s>",
	"eos_token": "</s>",
	},
	"datasets": [
	{
	"path": "mhenrichsen/alpaca_2k_test",
	"type": "alpaca",
	},
	],
	"num_epochs": 2,
	"micro_batch_size": 8,
	"gradient_accumulation_steps": 1,
	"output_dir": output_dir,
	"learning_rate": 0.00001,
	"optimizer": "adamw_torch",
	"lr_scheduler": "cosine",
	}
	)
	normalize_config(cfg)
	cli_args = TrainerCliArgs()
	dataset_meta = load_datasets(cfg=cfg, cli_args=cli_args)

	train(cfg=cfg, cli_args=cli_args, dataset_meta=dataset_meta)
	assert (Path(output_dir) / "adapter_model.bin").exists()

	def test_lora_gptq(self):
	# pylint: disable=duplicate-code
	output_dir = tempfile.mkdtemp()
	cfg = DictDefault(
	{
	"base_model": "TheBlokeAI/jackfram_llama-68m-GPTQ",
	"base_model_config": "TheBlokeAI/jackfram_llama-68m-GPTQ",
	"model_type": "AutoModelForCausalLM",
	"tokenizer_type": "LlamaTokenizer",
	"sequence_len": 1024,
	"sample_packing": True,
	"flash_attention": True,
	"load_in_8bit": True,
	"adapter": "lora",
	"gptq": True,
	"gptq_disable_exllama": True,
	"lora_r": 32,
	"lora_alpha": 64,
	"lora_dropout": 0.05,
	"lora_target_linear": True,
	"val_set_size": 0.1,
	"special_tokens": {
	"unk_token": "<unk>",
	"bos_token": "<s>",
	"eos_token": "</s>",
	},
	"datasets": [
	{
	"path": "mhenrichsen/alpaca_2k_test",
	"type": "alpaca",
	},
	],
	"num_epochs": 2,
	"save_steps": 0.5,
	"micro_batch_size": 8,
	"gradient_accumulation_steps": 1,
	"output_dir": output_dir,
	"learning_rate": 0.00001,
	"optimizer": "adamw_torch",
	"lr_scheduler": "cosine",
	}
	)
	normalize_config(cfg)
	cli_args = TrainerCliArgs()
	dataset_meta = load_datasets(cfg=cfg, cli_args=cli_args)

	train(cfg=cfg, cli_args=cli_args, dataset_meta=dataset_meta)
	assert (Path(output_dir) / "adapter_model.bin").exists()