Hopp til innhold
Nasjonalbiblioteket
|
Språkbanken
English
Språkbanken
Ressurskatalog
I samarbeid med
Vis filter
Skjul filter
Type
Opphav
Vis filter
Skjul filter
Tekst
31.01.2022
Målfrid 2022 – Fritt tilgjengelege tekster frå norske statlege nettsider
Dette korpuset inneheld dokument frå 571 internettdomene tilknytta norske statlege institusjonar. Totalt består materialet av omlag 4,5 milliardar "tokens" (ord og teiknsetting). I tillegg til …
Språk:
bokmål, nynorsk, engelsk, nordsamisk, sørsamisk, lulesamisk
Opphav:
Språkbanken
Lisens:
Norwegian Licence for Open Government Data (NLOD)
Type:
Tekst
Oppdatert:
31.01.2022
Tekst
11.01.2022
bokselskap.no 2022
bokselskap.no er et korpus av bøker og tekster som har falt i det fri, dvs. bøker/tekster av forfattere som har vært døde i minst 70 år, eller bøker og tekster som rettighetshaver har gitt sin …
Språk:
norsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tekst
Oppdatert:
11.01.2022
Tale
30.11.2021
Stortingskorpuset 1.1
Dette er versjon 1.1 av Stortingskorpuset (engelsk forkorting NPSC). Følgjande endringar skil versjon 1.1. frå versjon 1.0: - Dataa er delte opp i offisielle trenings-, evaluerings- og testsett. - …
Språk:
norsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tale
Oppdatert:
30.11.2021
Tekst
02.11.2021
Omsetjingsminne frå Nynorsk pressekontor 2021
Dette korpuset inneheld omsetjingar frå bokmål til nynorsk av nyhendetekst frå Norsk telegrambyrå (NTB). Tekstene er omsette av Nynorsk pressekontor (NPK), som nyttar den såkalla Nynorskroboten …
Språk:
bokmål, nynorsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tekst
Oppdatert:
02.11.2021
Tekst
28.10.2021
N-grammer fra NBdigital 2021
Dette korpuset inneholder n-grammer – unigrammer, bigrammer og trigrammer – fra alle bøker og aviser som var blitt digitalisert ved Nasjonalbiblioteket per juli 2021. N-grammene er laget på …
Språk:
bokmål, nynorsk, nordsamisk, sørsamisk, lulesamisk, kvensk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tekst
Oppdatert:
28.10.2021
Leksikon
28.09.2021
ONOMASTICA uttaleleksikon 2
ONOMASTICA versjon 2 er ein oppdatert versjon av ONOMASTICA. For å gjere uttaleleksikonet enklare tilgjengeleg, har Språkbanken parsa dei originale filene og generert ei fil i csv-format. Fila …
Språk:
norsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-BY (CC-BY)
Type:
Leksikon
Oppdatert:
28.09.2021
Tekst
18.08.2021
Omsetjingsminne frå EFTA
Desse omsetjingsminna er laga ved EEA Coordination Division ved Det europeiske frihandelsforbundet EFTAs sekretariat i Brussel, som mellom anna arbeider med omsetjing og publikasjonar i EFTA. …
Språk:
engelsk, bokmål, engelsk, nynorsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tekst
Oppdatert:
18.08.2021
Tale, Tekst
04.05.2021
TAUS – Talemålsundersøkelsen i Oslo
Materialet fra Talemålsundersøkelsen i Oslo (TAUS) er basert på uformelle intervjuer med folk fra Oslo, som ble gjort i 1971-73. Informantene er hovedsakelig fra to østlige bydeler (Vålerenga og …
Språk:
norsk, bokmål
Opphav:
CLARINO Tekstlaboratoriet
Lisens:
CLARIN_ACA-NC-LOC-PRIV-ND-*
Type:
Tale, Tekst
Oppdatert:
04.05.2021
Tekst
04.05.2021
TAUS – nedlastbare transkripsjoner
TAUS (Talemålsundersøkelsen i Oslo) v.3 er et talespråkskorpus med 86 talere og 387 551 tokens. Denne nedlastbare versjoner inneholder transkripsjonene, cirka 44 300 tokens. Alle transkripsjonene …
Språk:
norsk, bokmål
Opphav:
CLARINO Tekstlaboratoriet
Lisens:
Creative_Commons-BY-NC-SA (CC-BY-NC-SA)
Type:
Tekst
Oppdatert:
04.05.2021
Tekst
30.04.2021
Målfrid 2021 – Fritt tilgjengelege tekster frå norske statlege nettsider
Dette korpuset inneheld dokument frå 339 internettdomene tilknytta norske, statlege institusjonar. Totalt består materialet av omlag 4,1 milliardar "tokens" (ord og teiknsetjing), noko som gjer …
Språk:
bokmål, nynorsk, nordsamisk, sørsamisk, lulesamisk, engelsk
Opphav:
Språkbanken
Lisens:
Norwegian Licence for Open Government Data (NLOD)
Type:
Tekst
Oppdatert:
30.04.2021
Vis filter
Skjul filter