Pietro Lesci PRO

pietrolesci

https://pietrolesci.github.io/

AI & ML interests

I like developing and applying causal methods to study the effect of training choices on models’ behaviour, including memorisation, shortcut learning, and tokenisation.

Recent Activity

updated a collection 11 days ago

The Pile Companion

updated a collection 11 days ago

The Pile Companion

updated a dataset 12 days ago

InfoTokenizers/finewebedu-20B

View all activity

Organizations

Collections 10

models 21

pietrolesci/me100M_finewebedu-20B_bpe32000minipile

Updated Mar 20

pietrolesci/me100M-tied_finewebedu-20B_bpe32000minipile

Updated Mar 19

pietrolesci/me850M_minipile_bpe32000minipile

Updated Mar 14

pietrolesci/me340M-tied_minipile_bpe32000minipile

Updated Mar 14

pietrolesci/me57M-tied_minipile_bpe2wp32000minipile

Updated Mar 14

pietrolesci/me57M-tied_minipile_bpe128000minipile

Updated Mar 14

pietrolesci/me57M-tied_minipile_wordpiece32000minipile

Updated Mar 14

pietrolesci/me57M-tied_minipile_bpe8064minipile

Updated Mar 14

pietrolesci/me57M-tied_minipile_bpe32000minipile

Updated Mar 14

pietrolesci/tokenisers

Updated Feb 27

datasets 55

pietrolesci/pile-deduped

Viewer • Updated 17 days ago • 882M • 12.7k

pietrolesci/pythia-deduped-memorisation-profiles

Viewer • Updated 23 days ago • 2.13M • 48

pietrolesci/pile-validation

Viewer • Updated 23 days ago • 429k • 184

pietrolesci/pile-deduped-subset

Viewer • Updated 23 days ago • 16.3k • 26

pietrolesci/pythia-deduped-stats

Viewer • Updated 23 days ago • 16.3M • 1.19k

pietrolesci/pythia-deduped-stats-raw

Viewer • Updated 23 days ago • 14.9M • 18.2k

pietrolesci/agnews

Viewer • Updated 23 days ago • 510k • 99

pietrolesci/amazoncat-13k

Viewer • Updated 23 days ago • 5.99M • 390 • 1

pietrolesci/wikitoxic

Viewer • Updated 23 days ago • 894k • 166 • 1

pietrolesci/multiwoz_all_versions

Viewer • Updated 23 days ago • 82k • 79 • 1

Pietro Lesci PRO

AI & ML interests

Recent Activity

Organizations

Collections 10

Zyphra/Zyda-2

HuggingFaceTB/dclm-edu

HuggingFaceFW/fineweb-edu

HuggingFaceTB/stack-edu

pietrolesci/pile-deduped

pietrolesci/pile-deduped-pythia-preshuffled

pietrolesci/pile-deduped-pythia-tokfreq

pietrolesci/pile-validation

Papers 6

spaces 1

Wordify

models 21

pietrolesci/me100M_finewebedu-20B_bpe32000minipile

pietrolesci/me100M-tied_finewebedu-20B_bpe32000minipile

pietrolesci/me850M_minipile_bpe32000minipile

pietrolesci/me340M-tied_minipile_bpe32000minipile

pietrolesci/me57M-tied_minipile_bpe2wp32000minipile

pietrolesci/me57M-tied_minipile_bpe128000minipile

pietrolesci/me57M-tied_minipile_wordpiece32000minipile

pietrolesci/me57M-tied_minipile_bpe8064minipile

pietrolesci/me57M-tied_minipile_bpe32000minipile

pietrolesci/tokenisers

datasets 55

pietrolesci/pile-deduped

pietrolesci/pythia-deduped-memorisation-profiles

pietrolesci/pile-validation

pietrolesci/pile-deduped-subset

pietrolesci/pythia-deduped-stats

pietrolesci/pythia-deduped-stats-raw

pietrolesci/agnews

pietrolesci/amazoncat-13k

pietrolesci/wikitoxic

pietrolesci/multiwoz_all_versions

Pietro Lesci PRO

AI & ML interests

Recent Activity

Organizations

Collections 10

Papers 6

spaces 1

Wordify

models 21 Sort: Recently updated

datasets 55 Sort: Recently updated

models 21

datasets 55