Ressurser fra ressursbanken Archive - Side 3 av 125 - Språkbanken

Nasjonalbiblioteket Språkbanken

I samarbeid med

NB Samtale

NB Samtale er et talekorpus med ortografisk transkribert lydmateriale hentet fra podkaster og opptak av arrangementer på Nasjonalbiblioteket. Korpuset inneholder samtaler mellom flere personer, og …

Språk:
norsk
Distribuert av:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tale, Tekst
Oppdatert:
18.08.2023
Stortingskorpuset 2.0

Dette er versjon 2.0 av Stortingskorpuset (engelsk forkorting NPSC). I versjon 2.0 er det gjort ein del større endringar i transkripsjonane, i tillegg er nokre påviste feil i korpuset blitt retta. …

Språk:
norsk
Distribuert av:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tale, Tekst
Oppdatert:
13.07.2023
The Georgian National Corpus

International partnership project, supported by the Volkswagen Foundation within the program Between Europe and the Orient – A Focus on Research and Higher Education in/on Central Asia and the …

Språk:
Georgian, Middle Georgian, Old Georgian, Mingrelian, Svan
Distribuert av:
CLARINO Bergen
Lisens:
unspecified
Type:
Tekst
Oppdatert:
13.06.2023
Norsk UD-trebank

Universal Dependencies (UD) er eit rammeverk for å annotere grammatikk einsarta på tvers av ulike språk. Kategoriane for den grammatiske annotasjonen inkluderer orddeling (tokenization), ordklassar …

Språk:
bokmål, nynorsk
Distribuert av:
Språkbanken
Lisens:
Creative_Commons-BY-SA (CC-BY-SA)
Type:
Tekst
Oppdatert:
11.05.2023
Omsetjingsminne frå Nynorsk pressekontor 2022

Dette korpuset inneheld omsetjingar frå bokmål til nynorsk av nyhendetekst frå Norsk telegrambyrå (NTB). Tekstene er omsette av Nynorsk pressekontor (NPK), som nyttar Nynorskroboten til automatisk …

Språk:
bokmål, nynorsk
Distribuert av:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tekst
Oppdatert:
15.03.2023
NB Uttale

NB Uttale er et uttaleleksikon for bokmål laget av Språkbanken. Leksikonet består av 785.000 ord som er fonemisk transkribert til fem dialekter (dialektområder); østnorsk (Agder, Innlandet, Oslo, …

Språk:
norsk
Distribuert av:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Leksikon
Oppdatert:
13.03.2023
Norsk koreferansekorpus

Norwegian-BokmaalNARC og Norwegian-NynorskNARC er konverteringar av høvesvis bokmåls- og nynorskdelen av Norwegian Anaphora Resolution Corpus (NARC), det første offentleg tilgjengelege korpuset …

Språk:
bokmål, nynorsk
Distribuert av:
Språkbanken
Lisens:
Creative_Commons-BY-SA (CC-BY-SA)
Type:
Tekst
Oppdatert:
24.02.2023
ParlaMint-NO 1.2

ParlaMint-NO er den norske delen av ParlaMint-prosjektet, et EU-finansiert prosjekt støttet av CLARIN-ERIC. Prosjektets mål er å lage sammenlignbare og likt annoterte korpus basert på møtereferat …

Språk:
bokmål, nynorsk
Distribuert av:
Språkbanken
Lisens:
Creative_Commons-ZERO (CC-ZERO)
Type:
Tekst
Oppdatert:
09.02.2023
Målfrid 2023 – Fritt tilgjengelege tekster frå norske statlege nettsider

Dette korpuset inneheld dokument frå 525 internettdomene tilknytta norske statlege institusjonar. Totalt består materialet av omlag 3,5 milliardar "tokens" (ord og teiknsetting). I tillegg til …

Språk:
bokmål, nynorsk, engelsk, nordsamisk, sørsamisk, lulesamisk
Distribuert av:
Språkbanken
Lisens:
Norwegian Licence for Open Government Data (NLOD)
Type:
Tekst
Oppdatert:
31.01.2023
Text material from Forskning.no (1998 – 2012)

Data set containing texts from the popular science website forskning.no from the period 1998 - 2012. The text material is constituted by articles published by Forskning.no belonging to the following …

Språk:
norsk, bokmål
Distribuert av:
CLARINO Bergen
Lisens:
CLARIN_RES-DEP
Type:
Tekst
Oppdatert:
26.01.2023