LLM-HW3
Collection
Коллекция моделей, дообученных с помощью низкоранговых адаптаций на задачу классификации сентимента твита
•
3 items
•
Updated
Модель TinyLlama/TinyLlama-1.1B-Chat-v1.0
дообученная на датасете cardiffnlp/tweet_eval
, задача классификации сентимента твита, вывести одно из трех слов -
negative
, neutral
, positive
.
Модель дообучалась при помощи QLoRA.
8
load_in_4bit=True
bnb_4bit_quant_type="nf4"
bnb_4bit_compute_dtype=torch.float16
lora_alpha=4
lora_dropout=0.0
bias="none"
task_type="CAUSAL_LM"
num_train_epochs=1
per_device_train_batch_size=32
gradient_accumulation_steps=1
warmup_steps=100
group_by_length=True
lr_scheduler_type="cosine"
fp16=True
learning_rate=2e-4
weight_decay=1e-3
F1=0.18
Base model
TinyLlama/TinyLlama-1.1B-Chat-v1.0