sciencialab
/

software-mentions-models

Model card Files Files and versions Community

lfoppiano commited on Feb 21

Commit

47f9e3b

1 Parent(s): 134a99c

migrate models to HF

Browse files

Files changed (37) hide show

.gitattributes +1 -0
context_bert/config.json +20 -0
context_bert/model_weights.hdf5 +3 -0
context_bert/transformer-config.json +25 -0
context_bert/transformer-tokenizer/special_tokens_map.json +1 -0
context_bert/transformer-tokenizer/tokenizer.json +0 -0
context_bert/transformer-tokenizer/tokenizer_config.json +1 -0
context_bert/transformer-tokenizer/vocab.txt +0 -0
context_creation_bert/config.json +19 -0
context_creation_bert/model_weights.hdf5 +3 -0
context_creation_bert/transformer-config.json +25 -0
context_creation_bert/transformer-tokenizer/special_tokens_map.json +1 -0
context_creation_bert/transformer-tokenizer/tokenizer.json +0 -0
context_creation_bert/transformer-tokenizer/tokenizer_config.json +1 -0
context_creation_bert/transformer-tokenizer/vocab.txt +0 -0
context_shared_bert/config.json +19 -0
context_shared_bert/model_weights.hdf5 +3 -0
context_shared_bert/transformer-config.json +25 -0
context_shared_bert/transformer-tokenizer/special_tokens_map.json +1 -0
context_shared_bert/transformer-tokenizer/tokenizer.json +0 -0
context_shared_bert/transformer-tokenizer/tokenizer_config.json +1 -0
context_shared_bert/transformer-tokenizer/vocab.txt +0 -0
context_used_bert/config.json +19 -0
context_used_bert/model_weights.hdf5 +3 -0
context_used_bert/transformer-config.json +25 -0
context_used_bert/transformer-tokenizer/special_tokens_map.json +1 -0
context_used_bert/transformer-tokenizer/tokenizer.json +0 -0
context_used_bert/transformer-tokenizer/tokenizer_config.json +1 -0
context_used_bert/transformer-tokenizer/vocab.txt +0 -0
software-BERT/config.json +38 -0
software-BERT/model_weights.hdf5 +3 -0
software-BERT/preprocessor.json +646 -0
software-BERT/transformer-config.json +21 -0
software-BERT/transformer-tokenizer/special_tokens_map.json +7 -0
software-BERT/transformer-tokenizer/tokenizer.json +0 -0
software-BERT/transformer-tokenizer/tokenizer_config.json +19 -0
software-BERT/transformer-tokenizer/vocab.txt +0 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+*.hdf5 filter=lfs diff=lfs merge=lfs -text

context_bert/config.json ADDED Viewed

	@@ -0,0 +1,20 @@

+{
+    "model_name": "context_bert",
+    "architecture": "bert",
+    "embeddings_name": null,
+    "char_embedding_size": 25,
+    "word_embedding_size": 0,
+    "dropout": 0.5,
+    "recurrent_dropout": 0.25,
+    "maxlen": 100,
+    "dense_size": 32,
+    "use_char_feature": false,
+    "list_classes": [
+        "used",
+        "creation",
+        "shared"
+    ],
+    "fold_number": 1,
+    "batch_size": 32,
+    "transformer_name": "michiyasunaga/LinkBERT-base"
+}

context_bert/model_weights.hdf5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e0ea2189fa380300c38d697ee7edf59881177ec8fa844275c7718152b66be449
+size 433524128

context_bert/transformer-config.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "_name_or_path": "michiyasunaga/LinkBERT-base",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.15.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 28996
+}

context_bert/transformer-tokenizer/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"unk_token": "[UNK]", "sep_token": "[SEP]", "pad_token": "[PAD]", "cls_token": "[CLS]", "mask_token": "[MASK]"}

context_bert/transformer-tokenizer/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

context_bert/transformer-tokenizer/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@

+ {"do_lower_case": false, "unk_token": "[UNK]", "sep_token": "[SEP]", "pad_token": "[PAD]", "cls_token": "[CLS]", "mask_token": "[MASK]", "tokenize_chinese_chars": true, "strip_accents": null, "model_max_length": 512, "special_tokens_map_file": null, "name_or_path": "michiyasunaga/LinkBERT-base", "add_special_tokens": true, "max_length": 100, "add_prefix_space": true, "tokenizer_class": "BertTokenizer"}

context_bert/transformer-tokenizer/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

context_creation_bert/config.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+    "model_name": "context_creation_bert",
+    "architecture": "bert",
+    "embeddings_name": null,
+    "char_embedding_size": 25,
+    "word_embedding_size": 0,
+    "dropout": 0.5,
+    "recurrent_dropout": 0.25,
+    "maxlen": 100,
+    "dense_size": 32,
+    "use_char_feature": false,
+    "list_classes": [
+        "creation",
+        "not_creation"
+    ],
+    "fold_number": 1,
+    "batch_size": 32,
+    "transformer_name": "michiyasunaga/LinkBERT-base"
+}

context_creation_bert/model_weights.hdf5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:82c65aa8020380c2ac32b144e3a803549b9343370b3cb458f4a1c494f26dc2a4
+size 433521056

context_creation_bert/transformer-config.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "_name_or_path": "michiyasunaga/LinkBERT-base",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.15.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 28996
+}

context_creation_bert/transformer-tokenizer/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"unk_token": "[UNK]", "sep_token": "[SEP]", "pad_token": "[PAD]", "cls_token": "[CLS]", "mask_token": "[MASK]"}

context_creation_bert/transformer-tokenizer/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

context_creation_bert/transformer-tokenizer/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@

context_creation_bert/transformer-tokenizer/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

context_shared_bert/config.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+    "model_name": "context_shared_bert",
+    "architecture": "bert",
+    "embeddings_name": null,
+    "char_embedding_size": 25,
+    "word_embedding_size": 0,
+    "dropout": 0.5,
+    "recurrent_dropout": 0.25,
+    "maxlen": 100,
+    "dense_size": 32,
+    "use_char_feature": false,
+    "list_classes": [
+        "shared",
+        "not_shared"
+    ],
+    "fold_number": 1,
+    "batch_size": 32,
+    "transformer_name": "michiyasunaga/LinkBERT-base"
+}

context_shared_bert/model_weights.hdf5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7844fdf560ac0ad413503940457d2a5b9ea6069eca3e1a04ced69fca58f03c47
+size 433521056

context_shared_bert/transformer-config.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "_name_or_path": "michiyasunaga/LinkBERT-base",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.15.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 28996
+}

context_shared_bert/transformer-tokenizer/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"unk_token": "[UNK]", "sep_token": "[SEP]", "pad_token": "[PAD]", "cls_token": "[CLS]", "mask_token": "[MASK]"}

context_shared_bert/transformer-tokenizer/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

context_shared_bert/transformer-tokenizer/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@

context_shared_bert/transformer-tokenizer/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

context_used_bert/config.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+    "model_name": "context_used_bert",
+    "architecture": "bert",
+    "embeddings_name": null,
+    "char_embedding_size": 25,
+    "word_embedding_size": 0,
+    "dropout": 0.5,
+    "recurrent_dropout": 0.25,
+    "maxlen": 100,
+    "dense_size": 32,
+    "use_char_feature": false,
+    "list_classes": [
+        "used",
+        "not_used"
+    ],
+    "fold_number": 1,
+    "batch_size": 32,
+    "transformer_name": "michiyasunaga/LinkBERT-base"
+}

context_used_bert/model_weights.hdf5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:95ea068e2ab8ed28b22c984e32ac8ad0f8b6105c100d00ef9cad8b4dffb1be75
+size 433521056

context_used_bert/transformer-config.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "_name_or_path": "michiyasunaga/LinkBERT-base",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.15.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 28996
+}

context_used_bert/transformer-tokenizer/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"unk_token": "[UNK]", "sep_token": "[SEP]", "pad_token": "[PAD]", "cls_token": "[CLS]", "mask_token": "[MASK]"}

context_used_bert/transformer-tokenizer/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

context_used_bert/transformer-tokenizer/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@

context_used_bert/transformer-tokenizer/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

software-BERT/config.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+    "model_name": "software-BERT",
+    "architecture": "BERT",
+    "embeddings_name": null,
+    "char_vocab_size": 599,
+    "case_vocab_size": 8,
+    "char_embedding_size": 25,
+    "num_char_lstm_units": 25,
+    "max_char_length": 30,
+    "features_vocabulary_size": 12,
+    "features_indices": null,
+    "features_embedding_size": 4,
+    "features_lstm_units": 4,
+    "max_sequence_length": 512,
+    "word_embedding_size": 0,
+    "num_word_lstm_units": 100,
+    "case_embedding_size": 5,
+    "dropout": 0.5,
+    "recurrent_dropout": 0.5,
+    "use_crf": false,
+    "use_chain_crf": false,
+    "fold_number": 1,
+    "batch_size": 8,
+    "transformer_name": "allenai/scibert_scivocab_cased",
+    "use_ELMo": false,
+    "labels": {
+        "<PAD>": 0,
+        "B-<creator>": 1,
+        "B-<software>": 2,
+        "B-<url>": 3,
+        "B-<version>": 4,
+        "I-<creator>": 5,
+        "I-<software>": 6,
+        "I-<url>": 7,
+        "I-<version>": 8,
+        "O": 9
+    }
+}

software-BERT/model_weights.hdf5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9ea5e50e4d778c464a75f6bab2901107c5f50dbb16d62249efb4994390183a4d
+size 440060072

software-BERT/preprocessor.json ADDED Viewed

	@@ -0,0 +1,646 @@

+{
+    "padding": true,
+    "return_lengths": false,
+    "return_word_embeddings": false,
+    "return_casing": false,
+    "return_features": false,
+    "return_chars": false,
+    "return_bert_embeddings": true,
+    "vocab_char": {
+        "<PAD>": 0,
+        "<UNK>": 1,
+        "!": 2,
+        "\"": 3,
+        "#": 4,
+        "$": 5,
+        "%": 6,
+        "&": 7,
+        "'": 8,
+        "(": 9,
+        ")": 10,
+        "*": 11,
+        "+": 12,
+        ",": 13,
+        "-": 14,
+        ".": 15,
+        "/": 16,
+        "0": 17,
+        "1": 18,
+        "2": 19,
+        "3": 20,
+        "4": 21,
+        "5": 22,
+        "6": 23,
+        "7": 24,
+        "8": 25,
+        "9": 26,
+        ":": 27,
+        ";": 28,
+        "<": 29,
+        "=": 30,
+        ">": 31,
+        "?": 32,
+        "@": 33,
+        "A": 34,
+        "B": 35,
+        "C": 36,
+        "D": 37,
+        "E": 38,
+        "F": 39,
+        "G": 40,
+        "H": 41,
+        "I": 42,
+        "J": 43,
+        "K": 44,
+        "L": 45,
+        "M": 46,
+        "N": 47,
+        "O": 48,
+        "P": 49,
+        "Q": 50,
+        "R": 51,
+        "S": 52,
+        "T": 53,
+        "U": 54,
+        "V": 55,
+        "W": 56,
+        "X": 57,
+        "Y": 58,
+        "Z": 59,
+        "[": 60,
+        "\\": 61,
+        "]": 62,
+        "^": 63,
+        "_": 64,
+        "`": 65,
+        "a": 66,
+        "b": 67,
+        "c": 68,
+        "d": 69,
+        "e": 70,
+        "f": 71,
+        "g": 72,
+        "h": 73,
+        "i": 74,
+        "j": 75,
+        "k": 76,
+        "l": 77,
+        "m": 78,
+        "n": 79,
+        "o": 80,
+        "p": 81,
+        "q": 82,
+        "r": 83,
+        "s": 84,
+        "t": 85,
+        "u": 86,
+        "v": 87,
+        "w": 88,
+        "x": 89,
+        "y": 90,
+        "z": 91,
+        "{": 92,
+        "|": 93,
+        "}": 94,
+        "~": 95,
+        "\u00a1": 96,
+        "\u00a2": 97,
+        "\u00a3": 98,
+        "\u00a5": 99,
+        "\u00a7": 100,
+        "\u00a8": 101,
+        "\u00a9": 102,
+        "\u00aa": 103,
+        "\u00ab": 104,
+        "\u00ac": 105,
+        "\u00ae": 106,
+        "\u00af": 107,
+        "\u00b0": 108,
+        "\u00b1": 109,
+        "\u00b2": 110,
+        "\u00b3": 111,
+        "\u00b4": 112,
+        "\u00b5": 113,
+        "\u00b6": 114,
+        "\u00b7": 115,
+        "\u00b8": 116,
+        "\u00b9": 117,
+        "\u00ba": 118,
+        "\u00bb": 119,
+        "\u00bc": 120,
+        "\u00bd": 121,
+        "\u00be": 122,
+        "\u00bf": 123,
+        "\u00c0": 124,
+        "\u00c1": 125,
+        "\u00c2": 126,
+        "\u00c3": 127,
+        "\u00c4": 128,
+        "\u00c5": 129,
+        "\u00c7": 130,
+        "\u00c8": 131,
+        "\u00c9": 132,
+        "\u00ca": 133,
+        "\u00cd": 134,
+        "\u00d0": 135,
+        "\u00d1": 136,
+        "\u00d2": 137,
+        "\u00d3": 138,
+        "\u00d4": 139,
+        "\u00d5": 140,
+        "\u00d6": 141,
+        "\u00d7": 142,
+        "\u00d8": 143,
+        "\u00d9": 144,
+        "\u00da": 145,
+        "\u00dc": 146,
+        "\u00de": 147,
+        "\u00df": 148,
+        "\u00e0": 149,
+        "\u00e1": 150,
+        "\u00e2": 151,
+        "\u00e3": 152,
+        "\u00e4": 153,
+        "\u00e5": 154,
+        "\u00e7": 155,
+        "\u00e8": 156,
+        "\u00e9": 157,
+        "\u00ea": 158,
+        "\u00eb": 159,
+        "\u00ec": 160,
+        "\u00ed": 161,
+        "\u00ee": 162,
+        "\u00ef": 163,
+        "\u00f0": 164,
+        "\u00f1": 165,
+        "\u00f2": 166,
+        "\u00f3": 167,
+        "\u00f4": 168,
+        "\u00f5": 169,
+        "\u00f6": 170,
+        "\u00f7": 171,
+        "\u00f8": 172,
+        "\u00f9": 173,
+        "\u00fa": 174,
+        "\u00fb": 175,
+        "\u00fc": 176,
+        "\u00fd": 177,
+        "\u00fe": 178,
+        "\u0100": 179,
+        "\u0101": 180,
+        "\u0103": 181,
+        "\u0105": 182,
+        "\u0106": 183,
+        "\u0107": 184,
+        "\u0108": 185,
+        "\u0109": 186,
+        "\u010c": 187,
+        "\u010d": 188,
+        "\u0113": 189,
+        "\u0117": 190,
+        "\u0118": 191,
+        "\u011c": 192,
+        "\u012a": 193,
+        "\u012b": 194,
+        "\u0130": 195,
+        "\u0131": 196,
+        "\u0138": 197,
+        "\u013e": 198,
+        "\u0141": 199,
+        "\u0142": 200,
+        "\u0144": 201,
+        "\u0148": 202,
+        "\u014d": 203,
+        "\u0151": 204,
+        "\u0159": 205,
+        "\u015a": 206,
+        "\u015c": 207,
+        "\u015d": 208,
+        "\u015e": 209,
+        "\u015f": 210,
+        "\u0160": 211,
+        "\u0161": 212,
+        "\u0168": 213,
+        "\u0169": 214,
+        "\u016b": 215,
+        "\u0173": 216,
+        "\u0175": 217,
+        "\u0176": 218,
+        "\u0177": 219,
+        "\u017a": 220,
+        "\u017d": 221,
+        "\u017e": 222,
+        "\u0192": 223,
+        "\u021b": 224,
+        "\u025b": 225,
+        "\u0263": 226,
+        "\u0288": 227,
+        "\u02a6": 228,
+        "\u02b9": 229,
+        "\u02bc": 230,
+        "\u02c2": 231,
+        "\u02c3": 232,
+        "\u02c6": 233,
+        "\u02c7": 234,
+        "\u02c8": 235,
+        "\u02c9": 236,
+        "\u02d8": 237,
+        "\u02d9": 238,
+        "\u02da": 239,
+        "\u02db": 240,
+        "\u02dc": 241,
+        "\u0302": 242,
+        "\u0303": 243,
+        "\u0305": 244,
+        "\u030a": 245,
+        "\u0313": 246,
+        "\u0314": 247,
+        "\u034c": 248,
+        "\u0350": 249,
+        "\u0351": 250,
+        "\u0352": 251,
+        "\u0354": 252,
+        "\u0357": 253,
+        "\u0358": 254,
+        "\u0371": 255,
+        "\u0374": 256,
+        "\u0392": 257,
+        "\u0393": 258,
+        "\u0394": 259,
+        "\u0397": 260,
+        "\u0398": 261,
+        "\u039b": 262,
+        "\u039e": 263,
+        "\u03a0": 264,
+        "\u03a3": 265,
+        "\u03a4": 266,
+        "\u03a5": 267,
+        "\u03a6": 268,
+        "\u03a7": 269,
+        "\u03a8": 270,
+        "\u03a9": 271,
+        "\u03b1": 272,
+        "\u03b2": 273,
+        "\u03b3": 274,
+        "\u03b4": 275,
+        "\u03b5": 276,
+        "\u03b6": 277,
+        "\u03b7": 278,
+        "\u03b8": 279,
+        "\u03b9": 280,
+        "\u03ba": 281,
+        "\u03bb": 282,
+        "\u03bc": 283,
+        "\u03bd": 284,
+        "\u03be": 285,
+        "\u03c0": 286,
+        "\u03c1": 287,
+        "\u03c2": 288,
+        "\u03c3": 289,
+        "\u03c4": 290,
+        "\u03c5": 291,
+        "\u03c6": 292,
+        "\u03c7": 293,
+        "\u03c8": 294,
+        "\u03c9": 295,
+        "\u03d1": 296,
+        "\u03d2": 297,
+        "\u03d5": 298,
+        "\u03d6": 299,
+        "\u03e9": 300,
+        "\u03ea": 301,
+        "\u03eb": 302,
+        "\u03ed": 303,
+        "\u03ee": 304,
+        "\u03f1": 305,
+        "\u03f3": 306,
+        "\u03f5": 307,
+        "\u03f7": 308,
+        "\u03fd": 309,
+        "\u03fe": 310,
+        "\u0408": 311,
+        "\u0412": 312,
+        "\u0413": 313,
+        "\u041a": 314,
+        "\u041d": 315,
+        "\u0424": 316,
+        "\u0430": 317,
+        "\u0545": 318,
+        "\u0546": 319,
+        "\u0609": 320,
+        "\u060a": 321,
+        "\u060c": 322,
+        "\u060d": 323,
+        "\u060e": 324,
+        "\u0621": 325,
+        "\u0623": 326,
+        "\u0626": 327,
+        "\u0627": 328,
+        "\u0628": 329,
+        "\u0629": 330,
+        "\u062a": 331,
+        "\u062b": 332,
+        "\u062d": 333,
+        "\u062e": 334,
+        "\u062f": 335,
+        "\u0631": 336,
+        "\u0633": 337,
+        "\u0634": 338,
+        "\u0637": 339,
+        "\u0639": 340,
+        "\u0641": 341,
+        "\u0642": 342,
+        "\u0643": 343,
+        "\u0644": 344,
+        "\u0645": 345,
+        "\u0646": 346,
+        "\u0648": 347,
+        "\u0649": 348,
+        "\u064a": 349,
+        "\u064b": 350,
+        "\u0792": 351,
+        "\u1b80": 352,
+        "\u1e54": 353,
+        "\u1e63": 354,
+        "\u1e7c": 355,
+        "\u1e83": 356,
+        "\u1e90": 357,
+        "\u1e91": 358,
+        "\u1ebc": 359,
+        "\u1ebd": 360,
+        "\u1ef9": 361,
+        "\u1fb1": 362,
+        "\u1fbd": 363,
+        "\u2016": 364,
+        "\u201a": 365,
+        "\u2020": 366,
+        "\u2021": 367,
+        "\u2022": 368,
+        "\u2025": 369,
+        "\u2026": 370,
+        "\u202b": 371,
+        "\u202c": 372,
+        "\u2030": 373,
+        "\u2032": 374,
+        "\u2033": 375,
+        "\u2034": 376,
+        "\u203a": 377,
+        "\u203e": 378,
+        "\u2044": 379,
+        "\u204e": 380,
+        "\u20a9": 381,
+        "\u20ac": 382,
+        "\u2103": 383,
+        "\u2119": 384,
+        "\u211c": 385,
+        "\u211d": 386,
+        "\u2122": 387,
+        "\u2126": 388,
+        "\u2150": 389,
+        "\u2161": 390,
+        "\u2163": 391,
+        "\u2190": 392,
+        "\u2191": 393,
+        "\u2192": 394,
+        "\u2193": 395,
+        "\u2194": 396,
+        "\u21a6": 397,
+        "\u21c4": 398,
+        "\u21d2": 399,
+        "\u21d4": 400,
+        "\u2200": 401,
+        "\u2202": 402,
+        "\u2203": 403,
+        "\u2205": 404,
+        "\u2206": 405,
+        "\u2208": 406,
+        "\u220e": 407,
+        "\u2211": 408,
+        "\u2212": 409,
+        "\u2213": 410,
+        "\u2215": 411,
+        "\u221a": 412,
+        "\u221d": 413,
+        "\u221e": 414,
+        "\u2227": 415,
+        "\u2228": 416,
+        "\u2229": 417,
+        "\u222a": 418,
+        "\u222b": 419,
+        "\u2236": 420,
+        "\u223c": 421,
+        "\u2243": 422,
+        "\u2248": 423,
+        "\u2260": 424,
+        "\u2261": 425,
+        "\u2264": 426,
+        "\u2265": 427,
+        "\u226b": 428,
+        "\u227a": 429,
+        "\u227b": 430,
+        "\u2282": 431,
+        "\u2283": 432,
+        "\u2286": 433,
+        "\u2287": 434,
+        "\u2295": 435,
+        "\u2297": 436,
+        "\u22a5": 437,
+        "\u22c5": 438,
+        "\u22ef": 439,
+        "\u2329": 440,
+        "\u232a": 441,
+        "\u232c": 442,
+        "\u2338": 443,
+        "\u233a": 444,
+        "\u233d": 445,
+        "\u239b": 446,
+        "\u239d": 447,
+        "\u239e": 448,
+        "\u23a0": 449,
+        "\u2423": 450,
+        "\u2424": 451,
+        "\u2425": 452,
+        "\u2426": 453,
+        "\u2440": 454,
+        "\u24c7": 455,
+        "\u2500": 456,
+        "\u2502": 457,
+        "\u25a0": 458,
+        "\u25a1": 459,
+        "\u25aa": 460,
+        "\u25ab": 461,
+        "\u25b2": 462,
+        "\u25b3": 463,
+        "\u25b5": 464,
+        "\u25b6": 465,
+        "\u25b8": 466,
+        "\u25c6": 467,
+        "\u25c7": 468,
+        "\u25cb": 469,
+        "\u2605": 470,
+        "\u2610": 471,
+        "\u2713": 472,
+        "\u274f": 473,
+        "\u27e8": 474,
+        "\u27e9": 475,
+        "\u29cb": 476,
+        "\u2a7d": 477,
+        "\u2a7e": 478,
+        "\u3002": 479,
+        "\u3008": 480,
+        "\u3009": 481,
+        "\ud545": 482,
+        "\ue023": 483,
+        "\ue024": 484,
+        "\ue02c": 485,
+        "\ue02e": 486,
+        "\ue031": 487,
+        "\ue032": 488,
+        "\ue035": 489,
+        "\ue039": 490,
+        "\ue044": 491,
+        "\ue061": 492,
+        "\ue062": 493,
+        "\ue063": 494,
+        "\ue067": 495,
+        "\ue06b": 496,
+        "\ue06c": 497,
+        "\ue06d": 498,
+        "\ue06e": 499,
+        "\ue073": 500,
+        "\ue074": 501,
+        "\ue07a": 502,
+        "\ue103": 503,
+        "\ue104": 504,
+        "\uf025": 505,
+        "\uf03c": 506,
+        "\uf043": 507,
+        "\uf061": 508,
+        "\uf062": 509,
+        "\uf063": 510,
+        "\uf065": 511,
+        "\uf067": 512,
+        "\uf06b": 513,
+        "\uf06c": 514,
+        "\uf06d": 515,
+        "\uf070": 516,
+        "\uf073": 517,
+        "\uf074": 518,
+        "\uf077": 519,
+        "\uf0a2": 520,
+        "\uf0a3": 521,
+        "\uf0b0": 522,
+        "\uf0b1": 523,
+        "\uf0b4": 524,
+        "\uf0b6": 525,
+        "\uf0b9": 526,
+        "\uf0bb": 527,
+        "\uf0e0": 528,
+        "\uf0e2": 529,
+        "\uf0e4": 530,
+        "\uf0fc": 531,
+        "\uf643": 532,
+        "\uf644": 533,
+        "\uf645": 534,
+        "\uf646": 535,
+        "\uf647": 536,
+        "\uf648": 537,
+        "\uf649": 538,
+        "\uf64a": 539,
+        "\uf64b": 540,
+        "\uf64c": 541,
+        "\uf6f6": 542,
+        "\uf769": 543,
+        "\uf76a": 544,
+        "\uf76d": 545,
+        "\uf775": 546,
+        "\uf777": 547,
+        "\uf8e8": 548,
+        "\uff0b": 549,
+        "\uff0c": 550,
+        "\uff1a": 551,
+        "\uff1c": 552,
+        "\uff1d": 553,
+        "\uff1e": 554,
+        "\ufffd": 555,
+        "\ud835\udc34": 556,
+        "\ud835\udc36": 557,
+        "\ud835\udc37": 558,
+        "\ud835\udc39": 559,
+        "\ud835\udc3a": 560,
+        "\ud835\udc3b": 561,
+        "\ud835\udc3e": 562,
+        "\ud835\udc3f": 563,
+        "\ud835\udc43": 564,
+        "\ud835\udc47": 565,
+        "\ud835\udc4a": 566,
+        "\ud835\udc4c": 567,
+        "\ud835\udc50": 568,
+        "\ud835\udc51": 569,
+        "\ud835\udc52": 570,
+        "\ud835\udc53": 571,
+        "\ud835\udc54": 572,
+        "\ud835\udc56": 573,
+        "\ud835\udc57": 574,
+        "\ud835\udc58": 575,
+        "\ud835\udc5a": 576,
+        "\ud835\udc5e": 577,
+        "\ud835\udc5f": 578,
+        "\ud835\udc60": 579,
+        "\ud835\udc61": 580,
+        "\ud835\udc63": 581,
+        "\ud835\udc65": 582,
+        "\ud835\udd3c": 583,
+        "\ud835\udd40": 584,
+        "\ud835\udefc": 585,
+        "\ud835\udefd": 586,
+        "\ud835\udefe": 587,
+        "\ud835\udeff": 588,
+        "\ud835\udf00": 589,
+        "\ud835\udf03": 590,
+        "\ud835\udf06": 591,
+        "\ud835\udf07": 592,
+        "\ud835\udf0b": 593,
+        "\ud835\udf0d": 594,
+        "\ud835\udf0f": 595,
+        "\ud835\udf14": 596,
+        "\ud835\udf15": 597,
+        "\ud835\udf16": 598
+    },
+    "vocab_tag": {
+        "<PAD>": 0,
+        "B-<creator>": 1,
+        "B-<software>": 2,
+        "B-<url>": 3,
+        "B-<version>": 4,
+        "I-<creator>": 5,
+        "I-<software>": 6,
+        "I-<url>": 7,
+        "I-<version>": 8,
+        "O": 9
+    },
+    "vocab_case": [
+        "<PAD>",
+        "numeric",
+        "allLower",
+        "allUpper",
+        "initialUpper",
+        "other",
+        "mainly_numeric",
+        "contains_digit"
+    ],
+    "max_char_length": 30,
+    "feature_preprocessor": null,
+    "indice_tag": {
+        "0": "<PAD>",
+        "1": "B-<creator>",
+        "2": "B-<software>",
+        "3": "B-<url>",
+        "4": "B-<version>",
+        "5": "I-<creator>",
+        "6": "I-<software>",
+        "7": "I-<url>",
+        "8": "I-<version>",
+        "9": "O"
+    }
+}

software-BERT/transformer-config.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "_name_or_path": "allenai/scibert_scivocab_cased",
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.25.1",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 31116
+}

software-BERT/transformer-tokenizer/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

software-BERT/transformer-tokenizer/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

software-BERT/transformer-tokenizer/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "add_prefix_space": true,
+  "add_special_tokens": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": false,
+  "mask_token": "[MASK]",
+  "max_length": 512,
+  "model_max_length": 1000000000000000019884624838656,
+  "name_or_path": "allenai/scibert_scivocab_cased",
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "special_tokens_map_file": null,
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

software-BERT/transformer-tokenizer/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff