ThilinaGunathilaka
/

fine-tune-sinhala-bert-v2

Generated from Trainer

Model card Files Files and versions Community

ThilinaGunathilaka commited on Feb 1

Commit

555fab4

·

verified ·

1 Parent(s): 99d8dcc

Update README.md

Files changed (1) hide show

README.md +75 -6

README.md CHANGED Viewed

@@ -1,12 +1,81 @@
----
 license: mit
-datasets:
-- vrclc/dakshina-lexicons-ml
-language:
-- si
 base_model:
 - google-bert/bert-base-cased
 tags:
 - generated_from_trainer
 - finetune
----

+<!-- ---
 license: mit
 base_model:
 - google-bert/bert-base-cased
 tags:
 - generated_from_trainer
 - finetune
+--- -->
+---
+tags:
+- generated_from_trainer
+- finetune
+model-index:
+- name: fine-tune-sinhala-bert-v2
+  results: []
+datasets:
+- vrclc/dakshina-lexicons-ml
+base_model:
+- Ransaka/sinhala-bert-medium-v2
+widget:
+- text: "අපි තමයි [MASK] කරේ."
+- text: "මට හෙට එන්න වෙන්නේ [MASK]."
+- text: "අපි ගෙදර [MASK]."
+- text: 'සිංහල සහ [MASK] අලුත් අවුරුද්ද.'
+license: mit
+language:
+- si
+---
+# sinhala-bert-medium
+This model is pretrained on Sinhala data resources.
+## Model description
+    hidden_size = 786
+    num_hidden_layers = 6
+    num_attention_heads = 6
+    intermediate_size = 1024
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 5e-05
+- train_batch_size: 64
+- eval_batch_size: 8
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 6
+### Training results
+Epoch	Training Loss	Validation Loss
+1	    3.946600	    3.898129
+2	    3.782100	    3.800080
+3	    3.678300	    3.706316
+4	    3.485600	    3.646217
+5	    3.480900	    3.601913
+6	    3.420000	    3.615573
+### Framework versions
+- Transformers 4.33.3
+- Pytorch 2.0.0
+- Datasets 2.14.5
+- Tokenizers 0.13.3