Hopp til innhold

Norske idiom

Dette datasettet består av 3537 norske idiom og fraser som finst fleire enn 100 gonger i Nettbiblioteket. Det er 3455 idiom på bokmål og 88 på nynorsk. I framtida vil vi prøve å leggje til fleire idiom for nynorsk. Sjå dokumentasjonsfila for ei beskriving av datasettet. Dataa kan nyttast til å måle ein generativ språkmodell si evne til å fullføre kjende idiom eller som ei ‘masked language modelling’-oppgåve.

Dette datasettet består av 3537 norske idiom og fraser som finst fleire enn 100 gonger i Nettbiblioteket. Det er 3455 idiom på bokmål og 88 på nynorsk. I framtida vil vi prøve å leggje til fleire idiom for nynorsk. Sjå dokumentasjonsfila for ei beskriving av datasettet. Dataa kan nyttast til å måle ein generativ språkmodell si evne til å fullføre kjende idiom eller som ei ‘masked language modelling’-oppgåve.

Utvidet metadata

Last ned ressurser

Last ned metadata