Hopp til innhold
Nasjonalbiblioteket
|
Språkbanken
English
Språkbanken
Ressurskatalog
I samarbeid med
Vis filter
Skjul filter
Type
Opphav
Vis filter
Skjul filter
Tekst
10.10.2024
Norske idiom
Dette datasettet består av 3537 norske idiom og fraser som finst fleire enn 100 gonger i Nettbiblioteket. Det er 3455 idiom på bokmål og 88 på nynorsk. I framtida vil vi prøve å leggje til …
Språk:
bokmål, nynorsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tekst
Oppdatert:
10.10.2024
Tale
10.07.2024
Pressekonferanser fra DSS
Dette korpuset består av omlag 138 timers tale generert fra lyd med tidsjusterte undertekster fra pressekonferanser publisert av Departementenes sikkerhets- og serviceorganisasjon (DSS). Datasettet …
Opphav:
Språkbanken
Lisens:
Norwegian Licence for Open Government Data (NLOD)
Type:
Tale
Oppdatert:
10.07.2024
Tale, Tekst
23.03.2024
TeflonNorL2
Denne siden er en plassholder for de norske dataene i Teflon-prosjektet. Teflon-prosjektet (https://teflon.aalto.fi/) har som mål å studere dataassistert språklæring for innvandrerbarn som lærer …
Språk:
norsk
Opphav:
Språkbanken
Lisens:
unspecified
Type:
Tale, Tekst
Oppdatert:
23.03.2024
Verktøy
09.02.2024
Grafem-til-fonem-modeller for norsk bokmål
Denne ressursen innegolder grafem-til-fonem-modeller (G2P-modeller) for norsk bokmål som er tilpasset G2P-systemet Phonetisaurus (https://github.com/AdolfVonKleist/Phonetisaurus). G2P-modellene kan …
Språk:
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Verktøy
Oppdatert:
09.02.2024
Verktøy
11.01.2024
Glossa
Glossa is a tool for researchers who want to search linguistically annotated corpora. Glossa is designed to make it easy for researchers to: - create complex searches - explore the result via e.g. …
Språk:
Opphav:
CLARINO Tekstlaboratoriet
Lisens:
MIT license
Type:
Verktøy
Oppdatert:
11.01.2024
Tale, Tekst
19.12.2023
NST norsk ATG-database (16 kHz) – reorganisert
Denne databasen er laget av Nordisk språkteknologi som datagrunnlag for talegjenkjenning og diktering på norsk. I denne versjonen (fra 2022) er dataene strukturert på nytt, slik at databasen …
Språk:
norsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tale, Tekst
Oppdatert:
19.12.2023
Verktøy
20.11.2023
Kobling mellom norske kommuner og dialektregioner
Denne ressursen gir en kobling mellom norske kommuner og dialektregioner, og kan for eksempel brukes til å utlede dialektregionen til talere i et taledatasett basert på deres fødested. Koblingen er …
Opphav:
Språkbanken
Lisens:
Creative_Commons-BY (CC-BY)
Type:
Verktøy
Oppdatert:
20.11.2023
Tale, Tekst
15.11.2023
Stortinget Speech Corpus versjon 1.0
Stortinget Speech Corpus (SSC) er eit taledatasett på meir enn 5000 timar for svakt overvaka taleattkjenning laga av lydopptak og tekst frå Stortingsforhandlingane. Det inneheld taleeiningar på …
Språk:
norsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tale, Tekst
Oppdatert:
15.11.2023
Tekst
27.10.2023
NDT 2.0 med konstituentstruktur
I denne versjonen av Norsk dependenstrebank 2.0 er det lagt til konstituentstruktur (c-struktur) lik den man finner i NorGramBank. Med denne kan man trene én syntaktisk parser for begge de …
Språk:
bokmål, nynorsk
Opphav:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tekst
Oppdatert:
27.10.2023
Verktøy
20.10.2023
spaCy for nynorsk
Desse spaCy-modellane er trente på NorNE-datasettet i ein versjon som er kompatibel med Universal Dependencies. spaCy er eit mykje brukt python-bibliotek for språkteknologi. spaCy tilbyr ikkje …
Opphav:
Språkbanken
Lisens:
MIT license
Type:
Verktøy
Oppdatert:
20.10.2023
Vis filter
Skjul filter