AnirudhRajagopalan1201
/

tinystories-custom-20M

Model card Files Files and versions Community

AnirudhRajagopalan1201 commited on Oct 30, 2024

Commit

bffd58c

·

verified ·

1 Parent(s): 3f63300

Update README.md

Files changed (1) hide show

README.md +6 -4

README.md CHANGED Viewed

@@ -3,10 +3,11 @@ library_name: transformers
 datasets:
 - roneneldan/TinyStories
 ---
-Model trained on the TinyStories Dataset, replicating https://arxiv.org/abs/2305.07759
-Based on GPT-Neo architecture.
-hyperparams used to train this model:
 ```
         "batch_size": 32,
         "block_size": 256,
@@ -23,7 +24,8 @@ hyperparams used to train this model:
         "warmup_tokens": 10000,
         "gradient_accumulation_steps": 8
 ```
------- EXAMPLE USAGE ---
 ```py
   !pip install --quiet transformers
   from transformers import AutoModelForCausalLM, AutoTokenizer

 datasets:
 - roneneldan/TinyStories
 ---
+---
+Model trained on the TinyStories Dataset, replicating https://arxiv.org/abs/2305.07759, based on GPT-Neo architecture.
+---
+Hyperparams used to train this model:
 ```
         "batch_size": 32,
         "block_size": 256,
         "warmup_tokens": 10000,
         "gradient_accumulation_steps": 8
 ```
+---
+EXAMPLE USAGE
 ```py
   !pip install --quiet transformers
   from transformers import AutoModelForCausalLM, AutoTokenizer