Hopp til innhold

N-gram – bokmål

Disse n-grammene (n=1-6) er laget med utgangspunkt i tekstene i Norsk aviskorpus (24 nettaviser) og nyhetsdelen av tekstkorpuset etter Nordisk språkteknologi AS (NST). Det samlede tekstgrunnlaget for hele materialet er 1175 millioner ord med løpende tekst.

N-grammene er sortert henholdsvis alfabetisk og etter frekvens. Frekvenslister (unigram) er i tillegg publisert separat. En forenklet versjon med en liste over de 1000 mest frekvente n-grammene er også tilgjengelig.

Disse n-grammene (n=1-6) er laget med utgangspunkt i tekstene i Norsk aviskorpus (24 nettaviser) og nyhetsdelen av tekstkorpuset etter Nordisk språkteknologi AS (NST). Det samlede tekstgrunnlaget for hele materialet er 1175 millioner ord med løpende tekst.

N-grammene er sortert henholdsvis alfabetisk og etter frekvens. Frekvenslister (unigram) er i tillegg publisert separat. En forenklet versjon med en liste over de 1000 mest frekvente n-grammene er også tilgjengelig.

Utvidet metadata

Last ned ressurser

Last ned metadata