Hopp til innhold

Tuva Taledatabase

Tuva Taledatabase er utarbeidd av Max Manus AS for test og evaluering av dikteringsløysinga «Tuva».

Databasen inneheld omlag 24 timar innlesen tale frå 40 talarar. 36 av desse snakkar ei bokmålsnær dialekt, fire ei nynorsknær dialekt. Omlag 70% av materialet er manuskriptlesen tale og 30% er spontan tale. Manuskripta i den manuskriptlesne delen av korpuset er som regel korte avisartiklar. Av desse manuskripta vert 25% lesne av alle talarane, medan dei resterande 75% er unike for kvar talar.

All punktuering (punktum, komma, avsnitt osb.) vert lesen opp av innlesarane, og alle lydopptaka er ortografisk transkriberte i to ulike format.

For nynorsk finst det berre manuskriptlesen tale i korpuset.

Innlesarane i Tuva Taledatabase har vorte utvalde for å representere eit tverrsnitt av den norske arbeidsbefolkninga, balansert for alder, kjønn og dialekt.

Alle lydopptaka er utførde med 48 kHz punktprøvingsfrekvens og 32 bit oppløysing med ein mikrofon i ein kanal (mono). Opptaka vart gjennomførte i eit opptaksstudio i Oslo.

Tuva Taledatabase er utarbeidd av Max Manus AS for test og evaluering av dikteringsløysinga «Tuva».

Databasen inneheld omlag 24 timar innlesen tale frå 40 talarar. 36 av desse snakkar ei bokmålsnær dialekt, fire ei nynorsknær dialekt. Omlag 70% av materialet er manuskriptlesen tale og 30% er spontan tale. Manuskripta i den manuskriptlesne delen av korpuset er som regel korte avisartiklar. Av desse manuskripta vert 25% lesne av alle talarane, medan dei resterande 75% er unike for kvar talar.

All punktuering (punktum, komma, avsnitt osb.) vert lesen opp av innlesarane, og alle lydopptaka er ortografisk transkriberte i to ulike format.

For nynorsk finst det berre manuskriptlesen tale i korpuset.

Innlesarane i Tuva Taledatabase har vorte utvalde for å representere eit tverrsnitt av den norske arbeidsbefolkninga, balansert for alder, kjønn og dialekt.

Alle lydopptaka er utførde med 48 kHz punktprøvingsfrekvens og 32 bit oppløysing med ein mikrofon i ein kanal (mono). Opptaka vart gjennomførte i eit opptaksstudio i Oslo.

Utvidet metadata

Last ned ressurser

Last ned metadata