Hopp til innhold

Leksikografisk bokmålskorpus

Korpuset består av tekster hentet fra tilgjengelig litteratur/prosa fra 1985 til 2013. Korpuset har tekster fra fem sjangere: sakprosa (45%) skjønnlitteratur (35%) aviser og periodika (10%), TV-teksting( 5%), og upublisert materiale, småtrykk (5%), alt i alt 100 mill ord.
Korpuset er grammatisk merket med den opprinnelige versjonen av Oslo-Bergen taggeren.

Korpuset består av tekster hentet fra tilgjengelig litteratur/prosa fra 1985 til 2013. Korpuset har tekster fra fem sjangere: sakprosa (45%) skjønnlitteratur (35%) aviser og periodika (10%), TV-teksting( 5%), og upublisert materiale, småtrykk (5%), alt i alt 100 mill ord.
Korpuset er grammatisk merket med den opprinnelige versjonen av Oslo-Bergen taggeren.

Utvidet metadata

Last ned ressurser

Gå til ressursside