Update README.md
Browse files
README.md
CHANGED
@@ -1,7 +1,7 @@
|
|
1 |
---
|
2 |
base_model: aubmindlab/bert-base-arabertv02
|
3 |
-
datasets: []
|
4 |
-
language: []
|
5 |
library_name: sentence-transformers
|
6 |
pipeline_tag: sentence-similarity
|
7 |
tags:
|
@@ -12,44 +12,17 @@ tags:
|
|
12 |
- dataset_size:75000
|
13 |
- loss:MatryoshkaLoss
|
14 |
- loss:MultipleNegativesRankingLoss
|
15 |
-
widget:
|
16 |
-
- source_sentence: ุฑุฌู ููุธุฑ ุฅูู ู
ุง ูุจุฏู ุฃูู ูุทุน ู
ู ุงููุฑู ุงูู
ููู ูุงู
ุฑุฃุฉ ูู ุงูู
ุทุจุฎ.
|
17 |
-
sentences:
|
18 |
-
- ุฒูุฌ ูุฒูุฌุชู ูุชุฒูุฌุงู ุนูู ุงูุฌุจุงู ุงูุณููุณุฑูุฉ
|
19 |
-
- ู
ุง ูู ุงููุชุงุจ ุงูุฌูุฏ ูููุฑุงุกุฉุ
|
20 |
-
- ุฑุฌู ูุญุฏู ูู ุงู
ุฑุฃุฉ ูู ุงูู
ุทุจุฎ
|
21 |
-
- source_sentence: ุงูููุจ ุงูุฑู
ุงุฏู ูุฑูุถ ุนูู ุฌุงูุจ ุจุฑูุฉ ุจููู
ุง ุงูููุจ ุงูุฃุตูุฑ ูููุฒ ุฅูู ุงูุจุฑูุฉ.
|
22 |
-
sentences:
|
23 |
-
- ุงูููุงุจ ุชุฃูู ุนุดุงุฆูุง ุงููููู
|
24 |
-
- ููุงู ููุจุงู ุจุงูุฎุงุฑุฌ ุจุงููุฑุจ ู
ู ุญู
ุงู
ุงูุณุจุงุญุฉ
|
25 |
-
- ููู ุชุตูุน ุฒุฌุงุฌ ุจูุฑููุณุ
|
26 |
-
- source_sentence: ููู ูู
ูููุง ูุณุจ ุงูู
ุงู ู
ู ููุชููุจุ
|
27 |
-
sentences:
|
28 |
-
- ููู ูู
ูููู ูุณุจ ุงูู
ุงู ู
ู ุฎูุงู ุงูููุชููุจุ
|
29 |
-
- ูุชู ูุฑู
ู ุญููุจุฉ.
|
30 |
-
- ูู ูู
ูู ูุดุฎุต ู
ุชุญูู ุฌูุณูุงู ุฃู ูุนูุฏ ุฅูู ุฌูุณู ุงูุณุงุจู ุจุนุฏ ุฌุฑุงุญุฉ ุชุบููุฑ ุงูุฌูุณุ
|
31 |
-
- source_sentence: ููู ูุญุตู ุงูู
ุฑุก ุนูู ุฑูู
ูุงุชู ูุชุงุฉ ุจุณุฑุนุฉุ
|
32 |
-
sentences:
|
33 |
-
- ุงู
ุฑุฃุฉ ุชุชุณูู ูู ุณูู ุงูู
ุฒุงุฑุนูู
|
34 |
-
- ููู ุชุญุตู ุนูู ุฑูู
ูุงุชู ูุชุงุฉุ
|
35 |
-
- ููู ูู
ูููู ุงูุชุฎูุต ู
ู ุญุจ ุงูุดุจุงุจุ
|
36 |
-
- source_sentence: ู
ุง ูู ููุน ุงูุฏููู ุงูู
ูุฌูุฏุฉ ูู ุงูุฃูููุงุฏู
|
37 |
-
sentences:
|
38 |
-
- ุญูุงูู 15 ูู ุงูู
ุงุฆุฉ ู
ู ุงูุฏููู ูู ุงูุฃูููุงุฏู ู
ุดุจุนุฉ ุ ู
ุน ูู ููุจ ูุงุญุฏ ู
ู ุงูุฃูููุงุฏู
|
39 |
-
ุงูู
ูุฑูู
ูุญุชูู ุนูู 3.2 ุฌุฑุงู
ู
ู ุงูุฏููู ุงูู
ุดุจุนุฉ ุ ููู ู
ุง ูู
ุซู 16 ูู ุงูู
ุงุฆุฉ ู
ู DV
|
40 |
-
ุงูุจุงูุบ 20 ุฌุฑุงู
ูุง. ุชุญุชูู ุงูุฃูููุงุฏู ูู ุงูุบุงูุจ ุนูู ุฏููู ุฃุญุงุฏูุฉ ุบูุฑ ู
ุดุจุนุฉ ุ ู
ุน 67
|
41 |
-
ูู ุงูู
ุงุฆุฉ ู
ู ุฅุฌู
ุงูู ุงูุฏููู ุ ุฃู 14.7 ุฌุฑุงู
ูุง ููู ููุจ ู
ูุฑูู
ุ ููุชููู ู
ู ูุฐุง ุงูููุน
|
42 |
-
ู
ู ุงูุฏููู.
|
43 |
-
- ุงู
ุฑุฃุฉ ุชุณุชู
ุชุน ุจุฑุงุฆุญุฉ ุดุงููุง ูู ุงูููุงุก ุงูุทูู.
|
44 |
-
- ูู
ูู ุฃู ูุคุฏู ุงุฑุชูุงุน ู
ุณุชูู ุงูุฏููู ุงูุซูุงุซูุฉ ุ ููู ููุน ู
ู ุงูุฏููู (ุงูุฏููู) ูู ุงูุฏู
|
45 |
-
ุ ุฅูู ุฒูุงุฏุฉ ุฎุทุฑ ุงูุฅุตุงุจุฉ ุจุฃู
ุฑุงุถ ุงูููุจ ุ ููู
ูู ุฃู ูุคุฏู ุชูููุฑ ู
ุณุชูู ู
ุฑุชูุน ู
ู ุงูุฏููู
|
46 |
-
ุงูุซูุงุซูุฉ ุ ููู ููุน ู
ู ุงูุฏููู (ุงูุฏููู) ูู ุงูุฏู
ุ ุฅูู ุฒูุงุฏุฉ ุฎุทุฑ ุงูุฅุตุงุจุฉ ุจุฃู
ุฑุงุถ ุงูููุจ.
|
47 |
-
ู
ุฑุถ.
|
48 |
---
|
49 |
|
50 |
-
#
|
51 |
|
52 |
-
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [aubmindlab/bert-base-arabertv02](https://huggingface.co/aubmindlab/bert-base-arabertv02).
|
|
|
|
|
|
|
|
|
|
|
|
|
53 |
|
54 |
## Model Details
|
55 |
|
|
|
1 |
---
|
2 |
base_model: aubmindlab/bert-base-arabertv02
|
3 |
+
datasets: [akhooli/arabic-triplets-1m-curated-sims-len]
|
4 |
+
language: [ar]
|
5 |
library_name: sentence-transformers
|
6 |
pipeline_tag: sentence-similarity
|
7 |
tags:
|
|
|
12 |
- dataset_size:75000
|
13 |
- loss:MatryoshkaLoss
|
14 |
- loss:MultipleNegativesRankingLoss
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
15 |
---
|
16 |
|
17 |
+
# akhooli/Arabic-SBERT-100K
|
18 |
|
19 |
+
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [aubmindlab/bert-base-arabertv02](https://huggingface.co/aubmindlab/bert-base-arabertv02).
|
20 |
+
It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining,
|
21 |
+
text classification, clustering, and more.
|
22 |
+
This model is trained on 100K samples filtered from the `akhooli/arabic-triplets-1m-curated-sims-len` dataset with 75K training and 25K validation.
|
23 |
+
Trained for 5 epochs, with final training loss of 0.133 (using MatryoshkaLoss).
|
24 |
+
|
25 |
+
The rest of this file is auto generated.
|
26 |
|
27 |
## Model Details
|
28 |
|