Hopp til innhold
Nasjonalbiblioteket
|
Språkbanken
English
Språkbanken
Ressurskatalog
I samarbeid med
Vis filter
Skjul filter
Type
Opphav
Vis filter
Skjul filter
Tekst
09.02.2023
ParlaMint-NO 1.2
ParlaMint-NO er den norske delen av ParlaMint-prosjektet, et EU-finansiert prosjekt støttet av CLARIN-ERIC. Prosjektets mål er å lage sammenlignbare og likt annoterte korpus basert på møtereferat …
Språk:
bokmål, nynorsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tekst
Oppdatert:
09.02.2023
Tekst
31.01.2023
Målfrid 2023 – Fritt tilgjengelege tekster frå norske statlege nettsider
Dette korpuset inneheld dokument frå 525 internettdomene tilknytta norske statlege institusjonar. Totalt består materialet av omlag 3,5 milliardar "tokens" (ord og teiknsetting). I tillegg til …
Språk:
bokmål, nynorsk, engelsk, nordsamisk, sørsamisk, lulesamisk
Opphav:
Språkbanken
Lisens:
Norwegian Licence for Open Government Data (NLOD)
Type:
Tekst
Oppdatert:
31.01.2023
Tekst
26.01.2023
Text material from Forskning.no (1998 – 2012)
Data set containing texts from the popular science website forskning.no from the period 1998 - 2012. The text material is constituted by articles published by Forskning.no belonging to the following …
Språk:
norsk, bokmål
Opphav:
CLARINO Bergen
Lisens:
CLARIN_RES-DEP
Type:
Tekst
Oppdatert:
26.01.2023
Tekst
19.01.2023
bokselskap.no 2023
bokselskap.no er et korpus av bøker og tekster som har falt i det fri, dvs. materiale produsert av forfattere som har vært døde i minst 70 år, eller bøker og tekster som rettighetshaver har gitt …
Språk:
norsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tekst
Oppdatert:
19.01.2023
Verktøy
01.01.2023
NB DH-LAB
NB DH-LAB is er ein korpusinfrastruktur for digital humaniora og samfunnsvitskap. Infrastrukturen gjev forskarar moglegheiten til å gjere kvalitative og kvantitative undersøkingar av tekster frå …
Opphav:
Språkbanken
Lisens:
MIT license
Type:
Verktøy
Oppdatert:
01.01.2023
Tekst
23.12.2022
Omsetjingsminne frå Målfrid
Dette korpuset spring ut frå Målfrid-korpuset, og inneheld omsetjingsminne basert på parallellisert tekst frå 132 statlege domene. Filformatet er tmx for høvesvis språkpara engelsk-bokmål, …
Språk:
engelsk, bokmål, nynorsk
Opphav:
Språkbanken
Lisens:
Norwegian Licence for Open Government Data (NLOD)
Type:
Tekst
Oppdatert:
23.12.2022
Tekst
21.12.2022
Norsk aviskorpus bokmål
The Norwegian Newspaper Corpus (NNC) Bokmål version is a large monitor corpus representing contemporary Norwegian language in the written variety Norwegian Bokmål. A corresponding corpus is …
Språk:
norsk, bokmål
Opphav:
CLARINO Bergen
Lisens:
Creative_Commons-BY-NC (CC-BY-NC)
Type:
Tekst
Oppdatert:
21.12.2022
Tekst
21.12.2022
N-grammer fra NBdigital 2022
Dette korpuset inneholder n-grammer – uni-, bi- og trigrammer – fra alle bøker og aviser som var blitt digitalisert ved Nasjonalbiblioteket per 15. juli 2022. N-grammene er laget på basis av et …
Språk:
bokmål, nynorsk, nordsamisk, sørsamisk, lulesamisk, kvensk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tekst
Oppdatert:
21.12.2022
Tale, Tekst
15.12.2022
Norsk talestyringskorpus
Norsk talestyringskorpus (engelsk forkorting NVCC) er eit tekst- og talekorpus som består av skrivne og innlesne setningar (spørjingar). Dette er spørjingar ein typisk nyttar til å styre t.d. …
Språk:
norsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tale, Tekst
Oppdatert:
15.12.2022
Tale, Tekst
01.12.2022
LIA-trebanken
LIA-trebanken består av 7536 talemålssegment og 77 701 ord/token frå talespråkskorpuset LIA norsk. Trebanken er annotert morfologisk og syntaktisk og manuelt korrigert. LIA-trebanken er …
Språk:
norsk, nynorsk
Opphav:
CLARINO Tekstlaboratoriet
Lisens:
Creative_Commons-BY-NC-SA (CC-BY-NC-SA)
Type:
Tale, Tekst
Oppdatert:
01.12.2022
Vis filter
Skjul filter