Dette korpuset inneholder publiserte historiske stortingsforhandlinger fra Stortinget for perioden 1814-2000. De til sammen 2136 bindene er digitalisert, OCR-lest og prosessert ved Nasjonalbiblioteket, og ble tilgjengeliggjort på nett i 2014.
Denne nedlastbare versjonen tilgjengeliggjøres slik dataene foreligger, uten videre korrektur eller redigering. Det er viktig å være oppmerksom på at OCR-lesningen kan være av dårlig kvalitet, særlig for de eldre protokollene (før 1950).
Korpuset publiseres på formatet JSONL (JSON lines), se mer om dette i dokumentasjonsfilen. Det er en jsonl-fil per bind, til sammen 2136 filer, og omlag 1,5 milliarder ord (tokens).
Dette korpuset inneholder publiserte historiske stortingsforhandlinger fra Stortinget for perioden 1814-2000. De til sammen 2136 bindene er digitalisert, OCR-lest og prosessert ved Nasjonalbiblioteket, og ble tilgjengeliggjort på nett i 2014.
Denne nedlastbare versjonen tilgjengeliggjøres slik dataene foreligger, uten videre korrektur eller redigering. Det er viktig å være oppmerksom på at OCR-lesningen kan være av dårlig kvalitet, særlig for de eldre protokollene (før 1950).
Korpuset publiseres på formatet JSONL (JSON lines), se mer om dette i dokumentasjonsfilen. Det er en jsonl-fil per bind, til sammen 2136 filer, og omlag 1,5 milliarder ord (tokens).
description: Dette korpuset inneholder publiserte historiske stortingsforhandlinger fra Stortinget for perioden 1814-2000. De til sammen 2136 bindene er digitalisert, OCR-lest og prosessert ved Nasjonalbiblioteket, og ble tilgjengeliggjort på nett i 2014.
Denne nedlastbare versjonen tilgjengeliggjøres slik dataene foreligger, uten videre korrektur eller redigering. Det er viktig å være oppmerksom på at OCR-lesningen kan være av dårlig kvalitet, særlig for de eldre protokollene (før 1950).
Korpuset publiseres på formatet JSONL (JSON lines), se mer om dette i dokumentasjonsfilen. Det er en jsonl-fil per bind, til sammen 2136 filer, og omlag 1,5 milliarder ord (tokens).
description: This corpus contains published historical proceedings from the Norwegian parliament (Stortinget) 1814-2000. A total of 2136 volumes have been digitized, OCR-read and processed at the National Library of Norway, and were made available online in 2014.
This version is made available as is, without further correction and editing. It is important to be aware that the OCR can be of poor quality, especially for the older proceedings (before 1950).
The corpus is published in JSONL format (JSON lines), see the documentation file for details. There is one jsonl file per volume, i.e. a total of 2136 files, containing approximately 1.5 billion tokens.
Dette korpuset inneholder publiserte historiske stortingsforhandlinger fra Stortinget for perioden 1814-2000. De til sammen 2136 bindene er digitalisert, OCR-lest og prosessert ved Nasjonalbiblioteket, og ble tilgjengeliggjort på nett i 2014.
Denne nedlastbare versjonen tilgjengeliggjøres slik dataene foreligger, uten videre korrektur eller redigering. Det er viktig å være oppmerksom på at OCR-lesningen kan være av dårlig kvalitet, særlig for de eldre protokollene (før 1950).
Korpuset publiseres på formatet JSONL (JSON lines), se mer om dette i dokumentasjonsfilen. Det er en jsonl-fil per bind, til sammen 2136 filer, og omlag 1,5 milliarder ord (tokens).