Hopp til innhold
Nasjonalbiblioteket
|
Språkbanken
English
Språkbanken
Ressurskatalog
I samarbeid med
Vis filter
Skjul filter
Type
Opphav
Vis filter
Skjul filter
Tekst
23.12.2022
Omsetjingsminne frå Målfrid
Dette korpuset spring ut frå Målfrid-korpuset, og inneheld omsetjingsminne basert på parallellisert tekst frå 132 statlege domene. Filformatet er tmx for høvesvis språkpara engelsk-bokmål, …
Språk:
engelsk, bokmål, nynorsk
Opphav:
Språkbanken
Lisens:
Norwegian Licence for Open Government Data (NLOD)
Type:
Tekst
Oppdatert:
23.12.2022
Tekst
21.12.2022
Norsk aviskorpus bokmål
The Norwegian Newspaper Corpus (NNC) Bokmål version is a large monitor corpus representing contemporary Norwegian language in the written variety Norwegian Bokmål. A corresponding corpus is …
Språk:
norsk, bokmål
Opphav:
CLARINO Bergen
Lisens:
Creative_Commons-BY-NC (CC-BY-NC)
Type:
Tekst
Oppdatert:
21.12.2022
Tekst
21.12.2022
N-grammer fra NBdigital 2022
Dette korpuset inneholder n-grammer – uni-, bi- og trigrammer – fra alle bøker og aviser som var blitt digitalisert ved Nasjonalbiblioteket per 15. juli 2022. N-grammene er laget på basis av et …
Språk:
bokmål, nynorsk, nordsamisk, sørsamisk, lulesamisk, kvensk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tekst
Oppdatert:
21.12.2022
Tale, Tekst
15.12.2022
Norsk talestyringskorpus
Norsk talestyringskorpus (engelsk forkorting NVCC) er eit tekst- og talekorpus som består av skrivne og innlesne setningar (spørjingar). Dette er spørjingar ein typisk nyttar til å styre t.d. …
Språk:
norsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tale, Tekst
Oppdatert:
15.12.2022
Tale, Tekst
01.12.2022
LIA-trebanken
LIA-trebanken består av 7536 talemålssegment og 77 701 ord/token frå talespråkskorpuset LIA norsk. Trebanken er annotert morfologisk og syntaktisk og manuelt korrigert. LIA-trebanken er …
Språk:
norsk, nynorsk
Opphav:
CLARINO Tekstlaboratoriet
Lisens:
Creative_Commons-BY-NC-SA (CC-BY-NC-SA)
Type:
Tale, Tekst
Oppdatert:
01.12.2022
Tale, Tekst, Video
01.12.2022
NDC-trebanken
NDC-trebanken inneholder 4637 talemålssegment og 66 042 ord/token fra den norske delen av Nordisk dialektkorpus. Segmentene er hentet fra 30 transkriberte intervjuer fra 17 stader i Noreg. Trebanken …
Språk:
norsk, bokmål
Opphav:
CLARINO Tekstlaboratoriet
Lisens:
Creative_Commons-BY-NC-SA (CC-BY-NC-SA)
Type:
Tale, Tekst, Video
Oppdatert:
01.12.2022
Tekst
05.10.2022
META-NORD Sofie Danish Treebank
The Danish part of the META-NORD Sofie Parallel Treebank. This treebank is a syntactically annotated parallel corpus based on the first chapters of the novel “Sofies verden” (Sophie's World) by …
Språk:
dansk
Opphav:
CLARINO Bergen
Lisens:
unspecified
Type:
Tekst
Oppdatert:
05.10.2022
Tekst
05.10.2022
Text material from Forskning.no (1998 – 2017)
Data set containing texts from the popular science website forskning.no from the period 1998 - 2017. The text material is constituted by articles published by Forskning.no belonging to the following …
Språk:
norsk, bokmål
Opphav:
CLARINO Bergen
Lisens:
CLARIN_RES-DEP
Type:
Tekst
Oppdatert:
05.10.2022
Tekst
07.09.2022
Stortingsforhandlinger 1814-2000
Dette korpuset inneholder publiserte historiske stortingsforhandlinger fra Stortinget for perioden 1814-2000. De til sammen 2136 bindene er digitalisert, OCR-lest og prosessert ved …
Språk:
norsk
Opphav:
Språkbanken
Lisens:
Norwegian Licence for Open Government Data (NLOD)
Type:
Tekst
Oppdatert:
07.09.2022
Tale
04.04.2022
COLT – The Bergen Corpus of London Teenage Language (with audio recordings)
COLT is a corpus of London Teenage Language with audio recordings. It is now distributed via the search engine Corpuscle. Corpuscle allows you to pass queries to the corpus, and you may ask for …
Språk:
engelsk
Opphav:
CLARINO Bergen
Lisens:
CLARIN_ACA-NC-LOC-PRIV-ND-*
Type:
Tale
Oppdatert:
04.04.2022
Vis filter
Skjul filter