Nasjonalbiblioteket legg til rette for taleattkjenning på nynorsk
No blir det enkelt og billig å utvikle program som let deg styre mobiltelefonen ved hjelp av stemma eller få datamaskina til å lese opp kva som står i eit dokument – på nynorsk. Den nye uttaleordlista frå Språkbanken kan nyttast gratis av alle føretak.
- 14.04.2021
Det finst allereie mykje god taleteknologi for norsk, men denne støttar ofte berre bokmål.
– For å bøte på dette har vi no gjort tilgjengeleg ei uttaleordliste, som er ein viktig grunnlagsressurs for nynorsk taleteknologi, fortel Per Erik Solberg, som er språkteknolog ved Språkbanken i Nasjonalbiblioteket.
Uttaleordlista inneheld 570 000 nynorske ord og maskinlesbare, fonetiske transkripsjonar av orda. Å lage ei uttaleordliste av denne typen er eit omfattande og kostbart arbeid og krev spisskompetanse på norsk lydlære.
– For mange føretak vil det ikkje vere mogleg eller lønsamt å lage si eiga liste for nynorsk. Ved å tilby denne lista med open lisens gjer vi det billigare og enklare å utvikle taleteknologi for nynorsk, seier Solberg.
Taleattkjenningssystem, som omset tale til tekst, nyttar slike lister til å avgjere kva for lydstrengar som svarar til ord på nynorsk. I omsetting frå tekst til tale, gjev uttaleordlista informasjon om korleis den syntetiske stemma skal uttale nynorske ord.
Uttaleordlista blir delt i ressurskatalogen til Språkbanken, og lisensen tillèt at ho kan nyttast både av kommersielle og ikkje-kommersielle utviklarar. Ordlista er utvikla av trondheimsfirmaet Lingit.
Språkbanken tilbyr også ei tilsvarande liste for bokmål og held no fram med å utvide begge listene med meir dialektvariasjon og fleire ord, som gjer listene endå meir nyttige.