Hopp til innhold
Nasjonalbiblioteket
|
Språkbanken
English
Språkbanken
Ressurskatalog
I samarbeid med
Vis filter
Skjul filter
Type
Opphav
Vis filter
Skjul filter
Tale, Tekst
19.12.2023
NST norsk ATG-database (16 kHz) – reorganisert
Denne databasen er laget av Nordisk språkteknologi som datagrunnlag for talegjenkjenning og diktering på norsk. I denne versjonen (fra 2022) er dataene strukturert på nytt, slik at databasen …
Språk:
norsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tale, Tekst
Oppdatert:
19.12.2023
Verktøy
20.11.2023
Kobling mellom norske kommuner og dialektregioner
Denne ressursen gir en kobling mellom norske kommuner og dialektregioner, og kan for eksempel brukes til å utlede dialektregionen til talere i et taledatasett basert på deres fødested. Koblingen er …
Opphav:
Språkbanken
Lisens:
Creative_Commons-BY (CC-BY)
Type:
Verktøy
Oppdatert:
20.11.2023
Tale, Tekst
15.11.2023
Stortinget Speech Corpus versjon 1.0
Stortinget Speech Corpus (SSC) er eit taledatasett på meir enn 5000 timar for svakt overvaka taleattkjenning laga av lydopptak og tekst frå Stortingsforhandlingane. Det inneheld taleeiningar på …
Språk:
norsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tale, Tekst
Oppdatert:
15.11.2023
Tekst
27.10.2023
NDT 2.0 med konstituentstruktur
I denne versjonen av Norsk dependenstrebank 2.0 er det lagt til konstituentstruktur (c-struktur) lik den man finner i NorGramBank. Med denne kan man trene én syntaktisk parser for begge de …
Språk:
bokmål, nynorsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tekst
Oppdatert:
27.10.2023
Verktøy
20.10.2023
spaCy for nynorsk
Desse spaCy-modellane er trente på NorNE-datasettet i ein versjon som er kompatibel med Universal Dependencies. spaCy er eit mykje brukt python-bibliotek for språkteknologi. spaCy tilbyr ikkje …
Opphav:
Språkbanken
Lisens:
MIT license
Type:
Verktøy
Oppdatert:
20.10.2023
Tekst
24.08.2023
Norsk dependenstrebank 2.0
Dette er versjon 2.0 av Norsk dependenstrebank (NDT), opphavleg utvikla av Språkbanken/Nasjonalbiblioteket i 2011-2014. I versjon 2.0 av NDT er den grammatiske annotasjonen behaldt frå tidlegare …
Språk:
bokmål, nynorsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tekst
Oppdatert:
24.08.2023
Tale, Tekst
18.08.2023
NB Samtale
NB Samtale er et talekorpus med ortografisk transkribert lydmateriale hentet fra podkaster og opptak av arrangementer på Nasjonalbiblioteket. Korpuset inneholder samtaler mellom flere personer, og …
Språk:
norsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tale, Tekst
Oppdatert:
18.08.2023
Tale, Tekst
13.07.2023
Stortingskorpuset 2.0
Dette er versjon 2.0 av Stortingskorpuset (engelsk forkorting NPSC). I versjon 2.0 er det gjort ein del større endringar i transkripsjonane, i tillegg er nokre påviste feil i korpuset blitt retta. …
Språk:
norsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tale, Tekst
Oppdatert:
13.07.2023
Tekst
13.06.2023
The Georgian National Corpus
International partnership project, supported by the Volkswagen Foundation within the program Between Europe and the Orient – A Focus on Research and Higher Education in/on Central Asia and the …
Språk:
Georgian, Middle Georgian, Old Georgian, Mingrelian, Svan
Opphav:
CLARINO Bergen
Lisens:
unspecified
Type:
Tekst
Oppdatert:
13.06.2023
Tekst
11.05.2023
Norsk UD-trebank
Universal Dependencies (UD) er eit rammeverk for å annotere grammatikk einsarta på tvers av ulike språk. Kategoriane for den grammatiske annotasjonen inkluderer orddeling (tokenization), ordklassar …
Språk:
bokmål, nynorsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-BY-SA (CC-BY-SA)
Type:
Tekst
Oppdatert:
11.05.2023
Vis filter
Skjul filter