Ressurser fra ressursbanken Archive - Side 2 av 120 - Språkbanken

I samarbeid med

NST norsk ATG-database (16 kHz) – reorganisert

Denne databasen er laget av Nordisk språkteknologi som datagrunnlag for talegjenkjenning og diktering på norsk. I denne versjonen (fra 2022) er dataene strukturert på nytt, slik at databasen …

Språk:
norsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tale, Tekst
Oppdatert:
19.12.2023
Kobling mellom norske kommuner og dialektregioner

Denne ressursen gir en kobling mellom norske kommuner og dialektregioner, og kan for eksempel brukes til å utlede dialektregionen til talere i et taledatasett basert på deres fødested. Koblingen er …

Opphav:
Språkbanken
Lisens:
Creative_Commons-BY (CC-BY)
Type:
Verktøy
Oppdatert:
20.11.2023
Stortinget Speech Corpus versjon 1.0

Stortinget Speech Corpus (SSC) er eit taledatasett på meir enn 5000 timar for svakt overvaka taleattkjenning laga av lydopptak og tekst frå Stortingsforhandlingane. Det inneheld taleeiningar på …

Språk:
norsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tale, Tekst
Oppdatert:
15.11.2023
NDT 2.0 med konstituentstruktur

I denne versjonen av Norsk dependenstrebank 2.0 er det lagt til konstituentstruktur (c-struktur) lik den man finner i NorGramBank. Med denne kan man trene én syntaktisk parser for begge de …

Språk:
bokmål, nynorsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tekst
Oppdatert:
27.10.2023
spaCy for nynorsk

Desse spaCy-modellane er trente på NorNE-datasettet i ein versjon som er kompatibel med Universal Dependencies. spaCy er eit mykje brukt python-bibliotek for språkteknologi. spaCy tilbyr ikkje …

Opphav:
Språkbanken
Lisens:
MIT license
Type:
Verktøy
Oppdatert:
20.10.2023
Norsk dependenstrebank 2.0

Dette er versjon 2.0 av Norsk dependenstrebank (NDT), opphavleg utvikla av Språkbanken/Nasjonalbiblioteket i 2011-2014. I versjon 2.0 av NDT er den grammatiske annotasjonen behaldt frå tidlegare …

Språk:
bokmål, nynorsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tekst
Oppdatert:
24.08.2023
NB Samtale

NB Samtale er et talekorpus med ortografisk transkribert lydmateriale hentet fra podkaster og opptak av arrangementer på Nasjonalbiblioteket. Korpuset inneholder samtaler mellom flere personer, og …

Språk:
norsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tale, Tekst
Oppdatert:
18.08.2023
Stortingskorpuset 2.0

Dette er versjon 2.0 av Stortingskorpuset (engelsk forkorting NPSC). I versjon 2.0 er det gjort ein del større endringar i transkripsjonane, i tillegg er nokre påviste feil i korpuset blitt retta. …

Språk:
norsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tale, Tekst
Oppdatert:
13.07.2023
The Georgian National Corpus

International partnership project, supported by the Volkswagen Foundation within the program Between Europe and the Orient – A Focus on Research and Higher Education in/on Central Asia and the …

Språk:
Georgian, Middle Georgian, Old Georgian, Mingrelian, Svan
Opphav:
CLARINO Bergen
Lisens:
unspecified
Type:
Tekst
Oppdatert:
13.06.2023
Norsk UD-trebank

Universal Dependencies (UD) er eit rammeverk for å annotere grammatikk einsarta på tvers av ulike språk. Kategoriane for den grammatiske annotasjonen inkluderer orddeling (tokenization), ordklassar …

Språk:
bokmål, nynorsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-BY-SA (CC-BY-SA)
Type:
Tekst
Oppdatert:
11.05.2023