Benjaminpwh
/

xlsr-toratan-120-copt-siyu

Generated from Trainer

Model card Files Files and versions Community

Benjaminpwh commited on Apr 5

Commit

11d4c24

·

verified ·

1 Parent(s): 14ce7c8

Final continued pre-trained XLS-R model

Files changed (2) hide show

README.md +2 -2
model.safetensors +1 -1

README.md CHANGED Viewed

@@ -42,7 +42,7 @@ The following hyperparameters were used during training:
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.1
-- num_epochs: 20
 - mixed_precision_training: Native AMP
 ### Training results
@@ -51,7 +51,7 @@ The following hyperparameters were used during training:
 ### Framework versions
-- Transformers 4.51.0.dev0
 - Pytorch 2.6.0+cu124
 - Datasets 3.5.0
 - Tokenizers 0.21.1

 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.1
+- num_epochs: 15
 - mixed_precision_training: Native AMP
 ### Training results
 ### Framework versions
+- Transformers 4.52.0.dev0
 - Pytorch 2.6.0+cu124
 - Datasets 3.5.0
 - Tokenizers 0.21.1

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:393cc1694179a9a8d6c0c14f3dcad5ec8cd01bbdbf517af373768516702a0c85
 size 1269615448

 version https://git-lfs.github.com/spec/v1
+oid sha256:9f805ae2cc97c85c1641535430575aa0e9a12794fc6df5045547b21cd20446bf
 size 1269615448