Upload 12 files

Browse files

Files changed (12) hide show

config.json +36 -0
merges.txt +0 -0
optimizer.pt +3 -0
pytorch_model.bin +3 -0
rng_state.pth +3 -0
scheduler.pt +3 -0
special_tokens_map.json +15 -0
tokenizer.json +0 -0
tokenizer_config.json +16 -0
trainer_state.json +922 -0
training_args.bin +3 -0
vocab.json +0 -0

config.json ADDED Viewed

	@@ -0,0 +1,36 @@

+{
+  "_name_or_path": "roberta-base",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "human-produced",
+    "1": "machine-generated"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "human-produced": 0,
+    "machine-generated": 1
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.26.1",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cf3b1c9a1b4ae2ae04940a3d45196bcd5e7d0b84bdd8750d35868b56c2c0b87f
+size 997344965

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:65884bbeebba335c082512dee4b475947b08d83317a3c95f38550b5c85d0ef81
+size 498662069

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eb67e526eb3ee909ba650a3125bdfb951fa027b64d14c5d6847f72b90f3c71c3
+size 14575

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1d94bffac577c2182cd3b6680df4b0ff46f4c0a0b7ff9c866be7458145e68e80
+size 627

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "add_prefix_space": false,
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "errors": "replace",
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "name_or_path": "roberta-base",
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "special_tokens_map_file": null,
+  "tokenizer_class": "RobertaTokenizer",
+  "trim_offsets": true,
+  "unk_token": "<unk>"
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,922 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "global_step": 2188,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.0,
+      "learning_rate": 4.997714808043876e-05,
+      "loss": 0.701,
+      "step": 1
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 4.9017367458866546e-05,
+      "loss": 0.5623,
+      "step": 43
+    },
+    {
+      "epoch": 0.02,
+      "eval_accuracy": 0.9112,
+      "eval_f1": 0.9178386380458919,
+      "eval_loss": 0.3157382309436798,
+      "eval_precision": 0.8539944903581267,
+      "eval_recall": 0.992,
+      "eval_runtime": 31.9687,
+      "eval_samples_per_second": 117.302,
+      "eval_steps_per_second": 14.671,
+      "step": 43
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 4.8034734917733096e-05,
+      "loss": 0.4041,
+      "step": 86
+    },
+    {
+      "epoch": 0.04,
+      "eval_accuracy": 0.9682666666666667,
+      "eval_f1": 0.9688563203349909,
+      "eval_loss": 0.10907813906669617,
+      "eval_precision": 0.9511819116135662,
+      "eval_recall": 0.9872,
+      "eval_runtime": 31.8725,
+      "eval_samples_per_second": 117.656,
+      "eval_steps_per_second": 14.715,
+      "step": 86
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 4.705210237659964e-05,
+      "loss": 0.0811,
+      "step": 129
+    },
+    {
+      "epoch": 0.06,
+      "eval_accuracy": 0.9829333333333333,
+      "eval_f1": 0.9830777366472766,
+      "eval_loss": 0.11184453219175339,
+      "eval_precision": 0.9748295752490823,
+      "eval_recall": 0.9914666666666667,
+      "eval_runtime": 32.1826,
+      "eval_samples_per_second": 116.523,
+      "eval_steps_per_second": 14.573,
+      "step": 129
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 4.606946983546618e-05,
+      "loss": 0.1455,
+      "step": 172
+    },
+    {
+      "epoch": 0.08,
+      "eval_accuracy": 0.9826666666666667,
+      "eval_f1": 0.9828360179561658,
+      "eval_loss": 0.08915094286203384,
+      "eval_precision": 0.9733263598326359,
+      "eval_recall": 0.9925333333333334,
+      "eval_runtime": 31.7933,
+      "eval_samples_per_second": 117.949,
+      "eval_steps_per_second": 14.752,
+      "step": 172
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.5086837294332726e-05,
+      "loss": 0.1159,
+      "step": 215
+    },
+    {
+      "epoch": 0.1,
+      "eval_accuracy": 0.9722666666666666,
+      "eval_f1": 0.9729448491155047,
+      "eval_loss": 0.15372106432914734,
+      "eval_precision": 0.9497206703910615,
+      "eval_recall": 0.9973333333333333,
+      "eval_runtime": 31.823,
+      "eval_samples_per_second": 117.839,
+      "eval_steps_per_second": 14.738,
+      "step": 215
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.410420475319927e-05,
+      "loss": 0.1902,
+      "step": 258
+    },
+    {
+      "epoch": 0.12,
+      "eval_accuracy": 0.9765333333333334,
+      "eval_f1": 0.9769874476987447,
+      "eval_loss": 0.11824183911085129,
+      "eval_precision": 0.9584402257567983,
+      "eval_recall": 0.9962666666666666,
+      "eval_runtime": 31.879,
+      "eval_samples_per_second": 117.632,
+      "eval_steps_per_second": 14.712,
+      "step": 258
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 4.312157221206581e-05,
+      "loss": 0.0948,
+      "step": 301
+    },
+    {
+      "epoch": 0.14,
+      "eval_accuracy": 0.9917333333333334,
+      "eval_f1": 0.9917443408788282,
+      "eval_loss": 0.04853309690952301,
+      "eval_precision": 0.9904255319148936,
+      "eval_recall": 0.9930666666666667,
+      "eval_runtime": 32.1725,
+      "eval_samples_per_second": 116.559,
+      "eval_steps_per_second": 14.578,
+      "step": 301
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 4.213893967093236e-05,
+      "loss": 0.0947,
+      "step": 344
+    },
+    {
+      "epoch": 0.16,
+      "eval_accuracy": 0.9589333333333333,
+      "eval_f1": 0.960431654676259,
+      "eval_loss": 0.21628336608409882,
+      "eval_precision": 0.9266236985622212,
+      "eval_recall": 0.9968,
+      "eval_runtime": 31.9931,
+      "eval_samples_per_second": 117.213,
+      "eval_steps_per_second": 14.659,
+      "step": 344
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 4.1156307129798905e-05,
+      "loss": 0.1513,
+      "step": 387
+    },
+    {
+      "epoch": 0.18,
+      "eval_accuracy": 0.9885333333333334,
+      "eval_f1": 0.9884315308044122,
+      "eval_loss": 0.056088127195835114,
+      "eval_precision": 0.99728555917481,
+      "eval_recall": 0.9797333333333333,
+      "eval_runtime": 31.868,
+      "eval_samples_per_second": 117.673,
+      "eval_steps_per_second": 14.717,
+      "step": 387
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.017367458866545e-05,
+      "loss": 0.2024,
+      "step": 430
+    },
+    {
+      "epoch": 0.2,
+      "eval_accuracy": 0.9770666666666666,
+      "eval_f1": 0.9774869109947643,
+      "eval_loss": 0.11541605740785599,
+      "eval_precision": 0.9598971722365038,
+      "eval_recall": 0.9957333333333334,
+      "eval_runtime": 31.7697,
+      "eval_samples_per_second": 118.037,
+      "eval_steps_per_second": 14.763,
+      "step": 430
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 3.919104204753199e-05,
+      "loss": 0.0442,
+      "step": 473
+    },
+    {
+      "epoch": 0.22,
+      "eval_accuracy": 0.9872,
+      "eval_f1": 0.9871931696905016,
+      "eval_loss": 0.06453149765729904,
+      "eval_precision": 0.987720234917245,
+      "eval_recall": 0.9866666666666667,
+      "eval_runtime": 31.8692,
+      "eval_samples_per_second": 117.668,
+      "eval_steps_per_second": 14.716,
+      "step": 473
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 3.820840950639854e-05,
+      "loss": 0.0859,
+      "step": 516
+    },
+    {
+      "epoch": 0.24,
+      "eval_accuracy": 0.9792,
+      "eval_f1": 0.9794736842105262,
+      "eval_loss": 0.11312653124332428,
+      "eval_precision": 0.9667532467532467,
+      "eval_recall": 0.9925333333333334,
+      "eval_runtime": 31.8306,
+      "eval_samples_per_second": 117.811,
+      "eval_steps_per_second": 14.734,
+      "step": 516
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 3.7225776965265085e-05,
+      "loss": 0.0802,
+      "step": 559
+    },
+    {
+      "epoch": 0.26,
+      "eval_accuracy": 0.9866666666666667,
+      "eval_f1": 0.9867654843832716,
+      "eval_loss": 0.07340351492166519,
+      "eval_precision": 0.9795060430898581,
+      "eval_recall": 0.9941333333333333,
+      "eval_runtime": 31.9433,
+      "eval_samples_per_second": 117.396,
+      "eval_steps_per_second": 14.682,
+      "step": 559
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 3.624314442413163e-05,
+      "loss": 0.0754,
+      "step": 602
+    },
+    {
+      "epoch": 0.28,
+      "eval_accuracy": 0.9909333333333333,
+      "eval_f1": 0.9909718534253851,
+      "eval_loss": 0.05534309148788452,
+      "eval_precision": 0.9867794817556849,
+      "eval_recall": 0.9952,
+      "eval_runtime": 31.9035,
+      "eval_samples_per_second": 117.542,
+      "eval_steps_per_second": 14.701,
+      "step": 602
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 3.526051188299818e-05,
+      "loss": 0.0446,
+      "step": 645
+    },
+    {
+      "epoch": 0.29,
+      "eval_accuracy": 0.9802666666666666,
+      "eval_f1": 0.980546792849632,
+      "eval_loss": 0.10309968888759613,
+      "eval_precision": 0.966822187662001,
+      "eval_recall": 0.9946666666666667,
+      "eval_runtime": 31.8495,
+      "eval_samples_per_second": 117.741,
+      "eval_steps_per_second": 14.725,
+      "step": 645
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 3.4277879341864715e-05,
+      "loss": 0.2247,
+      "step": 688
+    },
+    {
+      "epoch": 0.31,
+      "eval_accuracy": 0.9837333333333333,
+      "eval_f1": 0.9839262187088275,
+      "eval_loss": 0.05565320700407028,
+      "eval_precision": 0.9723958333333333,
+      "eval_recall": 0.9957333333333334,
+      "eval_runtime": 31.8106,
+      "eval_samples_per_second": 117.885,
+      "eval_steps_per_second": 14.744,
+      "step": 688
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 3.329524680073126e-05,
+      "loss": 0.0198,
+      "step": 731
+    },
+    {
+      "epoch": 0.33,
+      "eval_accuracy": 0.972,
+      "eval_f1": 0.9726491273769211,
+      "eval_loss": 0.19524268805980682,
+      "eval_precision": 0.9506109979633401,
+      "eval_recall": 0.9957333333333334,
+      "eval_runtime": 31.8384,
+      "eval_samples_per_second": 117.782,
+      "eval_steps_per_second": 14.731,
+      "step": 731
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 3.231261425959781e-05,
+      "loss": 0.144,
+      "step": 774
+    },
+    {
+      "epoch": 0.35,
+      "eval_accuracy": 0.9845333333333334,
+      "eval_f1": 0.984688489968321,
+      "eval_loss": 0.07750081270933151,
+      "eval_precision": 0.9749085206481966,
+      "eval_recall": 0.9946666666666667,
+      "eval_runtime": 31.9146,
+      "eval_samples_per_second": 117.501,
+      "eval_steps_per_second": 14.695,
+      "step": 774
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 3.132998171846435e-05,
+      "loss": 0.1193,
+      "step": 817
+    },
+    {
+      "epoch": 0.37,
+      "eval_accuracy": 0.988,
+      "eval_f1": 0.9879194630872483,
+      "eval_loss": 0.04342731088399887,
+      "eval_precision": 0.9945945945945946,
+      "eval_recall": 0.9813333333333333,
+      "eval_runtime": 32.0746,
+      "eval_samples_per_second": 116.915,
+      "eval_steps_per_second": 14.622,
+      "step": 817
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 3.03473491773309e-05,
+      "loss": 0.0813,
+      "step": 860
+    },
+    {
+      "epoch": 0.39,
+      "eval_accuracy": 0.9773333333333334,
+      "eval_f1": 0.9777661522364636,
+      "eval_loss": 0.13094328343868256,
+      "eval_precision": 0.9594455852156057,
+      "eval_recall": 0.9968,
+      "eval_runtime": 31.8439,
+      "eval_samples_per_second": 117.762,
+      "eval_steps_per_second": 14.728,
+      "step": 860
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 2.9364716636197442e-05,
+      "loss": 0.1484,
+      "step": 903
+    },
+    {
+      "epoch": 0.41,
+      "eval_accuracy": 0.9893333333333333,
+      "eval_f1": 0.989406779661017,
+      "eval_loss": 0.04147784784436226,
+      "eval_precision": 0.9826407154129405,
+      "eval_recall": 0.9962666666666666,
+      "eval_runtime": 32.1496,
+      "eval_samples_per_second": 116.642,
+      "eval_steps_per_second": 14.588,
+      "step": 903
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 2.838208409506399e-05,
+      "loss": 0.0575,
+      "step": 946
+    },
+    {
+      "epoch": 0.43,
+      "eval_accuracy": 0.9936,
+      "eval_f1": 0.9935897435897435,
+      "eval_loss": 0.0342133492231369,
+      "eval_precision": 0.9951845906902087,
+      "eval_recall": 0.992,
+      "eval_runtime": 31.8831,
+      "eval_samples_per_second": 117.617,
+      "eval_steps_per_second": 14.71,
+      "step": 946
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 2.739945155393053e-05,
+      "loss": 0.0377,
+      "step": 989
+    },
+    {
+      "epoch": 0.45,
+      "eval_accuracy": 0.984,
+      "eval_f1": 0.9842022116903633,
+      "eval_loss": 0.08944225311279297,
+      "eval_precision": 0.9719188767550702,
+      "eval_recall": 0.9968,
+      "eval_runtime": 31.8105,
+      "eval_samples_per_second": 117.886,
+      "eval_steps_per_second": 14.744,
+      "step": 989
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 2.641681901279708e-05,
+      "loss": 0.023,
+      "step": 1032
+    },
+    {
+      "epoch": 0.47,
+      "eval_accuracy": 0.9666666666666667,
+      "eval_f1": 0.9676752004137574,
+      "eval_loss": 0.2229950875043869,
+      "eval_precision": 0.9392570281124498,
+      "eval_recall": 0.9978666666666667,
+      "eval_runtime": 32.2928,
+      "eval_samples_per_second": 116.125,
+      "eval_steps_per_second": 14.523,
+      "step": 1032
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 2.5434186471663625e-05,
+      "loss": 0.0147,
+      "step": 1075
+    },
+    {
+      "epoch": 0.49,
+      "eval_accuracy": 0.9922666666666666,
+      "eval_f1": 0.9922892847646902,
+      "eval_loss": 0.054798923432826996,
+      "eval_precision": 0.9893955461293743,
+      "eval_recall": 0.9952,
+      "eval_runtime": 31.9316,
+      "eval_samples_per_second": 117.439,
+      "eval_steps_per_second": 14.688,
+      "step": 1075
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 2.4451553930530165e-05,
+      "loss": 0.0904,
+      "step": 1118
+    },
+    {
+      "epoch": 0.51,
+      "eval_accuracy": 0.9946666666666667,
+      "eval_f1": 0.9946638207043758,
+      "eval_loss": 0.029427310451865196,
+      "eval_precision": 0.9951948745328351,
+      "eval_recall": 0.9941333333333333,
+      "eval_runtime": 31.7699,
+      "eval_samples_per_second": 118.036,
+      "eval_steps_per_second": 14.762,
+      "step": 1118
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 2.346892138939671e-05,
+      "loss": 0.0578,
+      "step": 1161
+    },
+    {
+      "epoch": 0.53,
+      "eval_accuracy": 0.9922666666666666,
+      "eval_f1": 0.992281075326058,
+      "eval_loss": 0.03940477967262268,
+      "eval_precision": 0.9904357066950054,
+      "eval_recall": 0.9941333333333333,
+      "eval_runtime": 31.7813,
+      "eval_samples_per_second": 117.994,
+      "eval_steps_per_second": 14.757,
+      "step": 1161
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 2.2486288848263255e-05,
+      "loss": 0.0049,
+      "step": 1204
+    },
+    {
+      "epoch": 0.55,
+      "eval_accuracy": 0.9837333333333333,
+      "eval_f1": 0.9839515916863982,
+      "eval_loss": 0.10390568524599075,
+      "eval_precision": 0.9709241952232607,
+      "eval_recall": 0.9973333333333333,
+      "eval_runtime": 31.8349,
+      "eval_samples_per_second": 117.795,
+      "eval_steps_per_second": 14.732,
+      "step": 1204
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 2.1503656307129798e-05,
+      "loss": 0.0008,
+      "step": 1247
+    },
+    {
+      "epoch": 0.57,
+      "eval_accuracy": 0.9930666666666667,
+      "eval_f1": 0.9930851063829788,
+      "eval_loss": 0.04775088652968407,
+      "eval_precision": 0.9904509283819629,
+      "eval_recall": 0.9957333333333334,
+      "eval_runtime": 31.8926,
+      "eval_samples_per_second": 117.582,
+      "eval_steps_per_second": 14.706,
+      "step": 1247
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 2.0521023765996345e-05,
+      "loss": 0.0437,
+      "step": 1290
+    },
+    {
+      "epoch": 0.59,
+      "eval_accuracy": 0.9848,
+      "eval_f1": 0.9849802371541502,
+      "eval_loss": 0.10180956870317459,
+      "eval_precision": 0.9734375,
+      "eval_recall": 0.9968,
+      "eval_runtime": 31.9165,
+      "eval_samples_per_second": 117.494,
+      "eval_steps_per_second": 14.695,
+      "step": 1290
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 1.953839122486289e-05,
+      "loss": 0.0482,
+      "step": 1333
+    },
+    {
+      "epoch": 0.61,
+      "eval_accuracy": 0.9952,
+      "eval_f1": 0.995187165775401,
+      "eval_loss": 0.03259880468249321,
+      "eval_precision": 0.9978552278820375,
+      "eval_recall": 0.9925333333333334,
+      "eval_runtime": 31.8461,
+      "eval_samples_per_second": 117.754,
+      "eval_steps_per_second": 14.727,
+      "step": 1333
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 1.8555758683729435e-05,
+      "loss": 0.0513,
+      "step": 1376
+    },
+    {
+      "epoch": 0.63,
+      "eval_accuracy": 0.9941333333333333,
+      "eval_f1": 0.9941302027748132,
+      "eval_loss": 0.03475691378116608,
+      "eval_precision": 0.99466097170315,
+      "eval_recall": 0.9936,
+      "eval_runtime": 31.7619,
+      "eval_samples_per_second": 118.066,
+      "eval_steps_per_second": 14.766,
+      "step": 1376
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 1.7573126142595978e-05,
+      "loss": 0.0184,
+      "step": 1419
+    },
+    {
+      "epoch": 0.65,
+      "eval_accuracy": 0.9888,
+      "eval_f1": 0.9888830068819482,
+      "eval_loss": 0.07543797791004181,
+      "eval_precision": 0.9816079873883342,
+      "eval_recall": 0.9962666666666666,
+      "eval_runtime": 31.8663,
+      "eval_samples_per_second": 117.679,
+      "eval_steps_per_second": 14.718,
+      "step": 1419
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 1.659049360146252e-05,
+      "loss": 0.0327,
+      "step": 1462
+    },
+    {
+      "epoch": 0.67,
+      "eval_accuracy": 0.9914666666666667,
+      "eval_f1": 0.9914984059511159,
+      "eval_loss": 0.05370575934648514,
+      "eval_precision": 0.9878242456326098,
+      "eval_recall": 0.9952,
+      "eval_runtime": 31.7637,
+      "eval_samples_per_second": 118.059,
+      "eval_steps_per_second": 14.765,
+      "step": 1462
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 1.5607861060329068e-05,
+      "loss": 0.0218,
+      "step": 1505
+    },
+    {
+      "epoch": 0.69,
+      "eval_accuracy": 0.988,
+      "eval_f1": 0.9880920878539297,
+      "eval_loss": 0.07749391347169876,
+      "eval_precision": 0.9805672268907563,
+      "eval_recall": 0.9957333333333334,
+      "eval_runtime": 32.0308,
+      "eval_samples_per_second": 117.075,
+      "eval_steps_per_second": 14.642,
+      "step": 1505
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 1.4625228519195613e-05,
+      "loss": 0.0592,
+      "step": 1548
+    },
+    {
+      "epoch": 0.71,
+      "eval_accuracy": 0.9906666666666667,
+      "eval_f1": 0.9907137171663571,
+      "eval_loss": 0.05098994821310043,
+      "eval_precision": 0.9857444561774024,
+      "eval_recall": 0.9957333333333334,
+      "eval_runtime": 32.1011,
+      "eval_samples_per_second": 116.818,
+      "eval_steps_per_second": 14.61,
+      "step": 1548
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 1.3642595978062158e-05,
+      "loss": 0.0506,
+      "step": 1591
+    },
+    {
+      "epoch": 0.73,
+      "eval_accuracy": 0.9928,
+      "eval_f1": 0.9928172386272945,
+      "eval_loss": 0.040217798203229904,
+      "eval_precision": 0.9904458598726115,
+      "eval_recall": 0.9952,
+      "eval_runtime": 32.4765,
+      "eval_samples_per_second": 115.468,
+      "eval_steps_per_second": 14.441,
+      "step": 1591
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 1.2659963436928701e-05,
+      "loss": 0.0228,
+      "step": 1634
+    },
+    {
+      "epoch": 0.75,
+      "eval_accuracy": 0.9946666666666667,
+      "eval_f1": 0.9946695095948828,
+      "eval_loss": 0.031395528465509415,
+      "eval_precision": 0.9941395844432606,
+      "eval_recall": 0.9952,
+      "eval_runtime": 32.1532,
+      "eval_samples_per_second": 116.629,
+      "eval_steps_per_second": 14.586,
+      "step": 1634
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 1.1677330895795248e-05,
+      "loss": 0.0297,
+      "step": 1677
+    },
+    {
+      "epoch": 0.77,
+      "eval_accuracy": 0.9928,
+      "eval_f1": 0.9928210582291943,
+      "eval_loss": 0.044785238802433014,
+      "eval_precision": 0.9899257688229056,
+      "eval_recall": 0.9957333333333334,
+      "eval_runtime": 32.1967,
+      "eval_samples_per_second": 116.472,
+      "eval_steps_per_second": 14.567,
+      "step": 1677
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 1.0694698354661791e-05,
+      "loss": 0.0138,
+      "step": 1720
+    },
+    {
+      "epoch": 0.79,
+      "eval_accuracy": 0.9853333333333333,
+      "eval_f1": 0.9855072463768116,
+      "eval_loss": 0.09062495082616806,
+      "eval_precision": 0.9739583333333334,
+      "eval_recall": 0.9973333333333333,
+      "eval_runtime": 32.0852,
+      "eval_samples_per_second": 116.876,
+      "eval_steps_per_second": 14.617,
+      "step": 1720
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 9.712065813528338e-06,
+      "loss": 0.0949,
+      "step": 1763
+    },
+    {
+      "epoch": 0.81,
+      "eval_accuracy": 0.9941333333333333,
+      "eval_f1": 0.994136460554371,
+      "eval_loss": 0.028302613645792007,
+      "eval_precision": 0.9936068193926478,
+      "eval_recall": 0.9946666666666667,
+      "eval_runtime": 32.2498,
+      "eval_samples_per_second": 116.28,
+      "eval_steps_per_second": 14.543,
+      "step": 1763
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 8.729433272394881e-06,
+      "loss": 0.0614,
+      "step": 1806
+    },
+    {
+      "epoch": 0.83,
+      "eval_accuracy": 0.9941333333333333,
+      "eval_f1": 0.9941333333333333,
+      "eval_loss": 0.029561299830675125,
+      "eval_precision": 0.9941333333333333,
+      "eval_recall": 0.9941333333333333,
+      "eval_runtime": 32.2034,
+      "eval_samples_per_second": 116.447,
+      "eval_steps_per_second": 14.564,
+      "step": 1806
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 7.746800731261426e-06,
+      "loss": 0.0012,
+      "step": 1849
+    },
+    {
+      "epoch": 0.85,
+      "eval_accuracy": 0.9936,
+      "eval_f1": 0.9936068193926478,
+      "eval_loss": 0.03323618695139885,
+      "eval_precision": 0.9925492283129325,
+      "eval_recall": 0.9946666666666667,
+      "eval_runtime": 32.2063,
+      "eval_samples_per_second": 116.437,
+      "eval_steps_per_second": 14.562,
+      "step": 1849
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 6.764168190127972e-06,
+      "loss": 0.015,
+      "step": 1892
+    },
+    {
+      "epoch": 0.86,
+      "eval_accuracy": 0.9944,
+      "eval_f1": 0.9943955164131306,
+      "eval_loss": 0.03202632814645767,
+      "eval_precision": 0.9951923076923077,
+      "eval_recall": 0.9936,
+      "eval_runtime": 32.1602,
+      "eval_samples_per_second": 116.604,
+      "eval_steps_per_second": 14.583,
+      "step": 1892
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 5.781535648994515e-06,
+      "loss": 0.0266,
+      "step": 1935
+    },
+    {
+      "epoch": 0.88,
+      "eval_accuracy": 0.9922666666666666,
+      "eval_f1": 0.9922933829391443,
+      "eval_loss": 0.042477842420339584,
+      "eval_precision": 0.9888771186440678,
+      "eval_recall": 0.9957333333333334,
+      "eval_runtime": 32.2356,
+      "eval_samples_per_second": 116.331,
+      "eval_steps_per_second": 14.549,
+      "step": 1935
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 4.798903107861061e-06,
+      "loss": 0.0292,
+      "step": 1978
+    },
+    {
+      "epoch": 0.9,
+      "eval_accuracy": 0.9901333333333333,
+      "eval_f1": 0.9901934799893983,
+      "eval_loss": 0.04828348755836487,
+      "eval_precision": 0.9841938883034773,
+      "eval_recall": 0.9962666666666666,
+      "eval_runtime": 32.2496,
+      "eval_samples_per_second": 116.281,
+      "eval_steps_per_second": 14.543,
+      "step": 1978
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 3.816270566727605e-06,
+      "loss": 0.0141,
+      "step": 2021
+    },
+    {
+      "epoch": 0.92,
+      "eval_accuracy": 0.9890666666666666,
+      "eval_f1": 0.9891505689335803,
+      "eval_loss": 0.052797310054302216,
+      "eval_precision": 0.9816176470588235,
+      "eval_recall": 0.9968,
+      "eval_runtime": 32.2638,
+      "eval_samples_per_second": 116.229,
+      "eval_steps_per_second": 14.536,
+      "step": 2021
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 2.83363802559415e-06,
+      "loss": 0.0006,
+      "step": 2064
+    },
+    {
+      "epoch": 0.94,
+      "eval_accuracy": 0.9909333333333333,
+      "eval_f1": 0.9909862142099681,
+      "eval_loss": 0.04819910600781441,
+      "eval_precision": 0.985239852398524,
+      "eval_recall": 0.9968,
+      "eval_runtime": 32.596,
+      "eval_samples_per_second": 115.045,
+      "eval_steps_per_second": 14.388,
+      "step": 2064
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 1.851005484460695e-06,
+      "loss": 0.0225,
+      "step": 2107
+    },
+    {
+      "epoch": 0.96,
+      "eval_accuracy": 0.9922666666666666,
+      "eval_f1": 0.9922933829391443,
+      "eval_loss": 0.03804012015461922,
+      "eval_precision": 0.9888771186440678,
+      "eval_recall": 0.9957333333333334,
+      "eval_runtime": 32.1606,
+      "eval_samples_per_second": 116.602,
+      "eval_steps_per_second": 14.583,
+      "step": 2107
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 8.683729433272396e-07,
+      "loss": 0.0199,
+      "step": 2150
+    },
+    {
+      "epoch": 0.98,
+      "eval_accuracy": 0.9925333333333334,
+      "eval_f1": 0.9925492283129324,
+      "eval_loss": 0.036869850009679794,
+      "eval_precision": 0.9904407859798194,
+      "eval_recall": 0.9946666666666667,
+      "eval_runtime": 32.2379,
+      "eval_samples_per_second": 116.323,
+      "eval_steps_per_second": 14.548,
+      "step": 2150
+    }
+  ],
+  "max_steps": 2188,
+  "num_train_epochs": 1,
+  "total_flos": 4604443468800000.0,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4abcbcb0e793c20ba879c1c33344ec0286718691f8480e70240e684b2ecc0883
+size 3451

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff