– Spæll sangen fra byn’sjla! Nå får taleassistenter hjelp til å forstå norske dialekter
Nå har språkteknologer knekt koden for å få Siri og Alexa til å skjønne norske dialekter.
Har du noen gang bedt Siri eller Alexa om å ringe en venn og fått beskjed om at hun ikke forstår deg? Sitter du i bilen og ber taleassistenten spille en sang, men må legge om til bokmål for å få det til?
Denne dialektnøtta har språkteknologene på Nasjonalbiblioteket nå gjort et arbeid for å knekke.
Å spille av en sang, åpne en e-post eller å ringe noen er ofte det man bruker talestyring til. Enten det er på telefonen eller i bilen.
Stor variasjon av dialekter
Norge er et land med stor variasjon av dialekter. Det kan by på utfordringer når man skal be taleassistenten løse små – og noen ganger større – oppgaver.
I dag er assistentene bedre på noen dialekter og sannsynligvis er det østlendingene som har det lettest. Forskjellene i uttale, dialektord og talemåter mellom siddiser og ranværinger er ikke bare enkelt for datamaskinene å tyde.
Det er dette problemet språkviter Marie Iversdatter Røsok, språkteknolog Per Erik Solberg og kollegaene i Språkbanken ved Nasjonalbiblioteket vil løse.
Har samlet inn 10.000 ytringer
Derfor har de nå hentet inn 10.000 ytringer på forskjellige norske dialekter. Disse er så gjort tilgjengelige for leverandører av taleassistenter.
Ved hjelp av alle disse forskjellige setningene og kommandoene kan den kunstige intelligensen som taleassistentene bruker, lære seg hvordan forskjellige norske dialekter høres ut.
Følgen kan være at de for eksempel blir bedre i stand til å forstå trøndersk palatalisering. Palatalisering er når man sier mannj og kvellj i stedet for for mann og kveld.
Nå kan taleassistenten lære seg å forstå dette
- spæll sangen fra byn’sjla – spill sangen fra begynnelsen
- æ vil vessta kor mytji klokka e – jeg vil vite hvor mye klokka er
- korsen dato e det – hvilken dato er det
- sle tå høgtalaren – slå av høyttaleren
- kest e Nasjonalbiblioteket – hvor er Nasjonalbiblioteket
- spel songen atte ittepå – spill sangen igjen etterpå
- du lyt åpne meldingi – du må åpne meldingen
Hvordan lærer man en datamaskin dialekt?
Språkteknologene startet med å undersøke grundig hvilke funksjoner taleassistenter faktisk kan styre i dag.
– Dette gjorde vi ved å gå gjennom det andre har skrevet om dette. Vi beskrev også selv de forskjellige funksjonene vi fant på en iPhone, forteller Marie Iversdatter Røsok.
Deretter ble det satt opp kategorier. De beskriver hva taleassistenten skal brukes til.
– Det kan for eksempel være å åpne en melding, ta i bruk podkastappen eller stille vekkerklokken på mobilen. Til slutt satt vi oss ned og rett og slett skrev setninger vi selv ville sagt til en taleassistent innenfor disse kategoriene, sier Røsok.
Ytringene taleassistentene skal ta i bruk for å lære dialekter, er gjenkjennelige for de fleste som har prøvd talestyring. Det er kommandoer som «skru på lydløs», «åpne ny melding» og «spill neste sang».
Delte inn i fem ulike dialektområder
Alt ble lest inn av elleve forskjellige personer fra fem ulike dialektområder. Blant annet fra Rana, Stavanger, Klepp og Jostedal.
Blant de som leste inn, var det en av hvert kjønn fra hvert dialektområde. Alderen deres var fra 25 til 59 år. Til sammen var det rundt ti tusen varianter av setningene som ble lest inn.
– Først ba vi innleserne lese inn alle ytringene slik de var skrevet. Deretter skulle de snakke mer fritt. For å få det best mulig ba vi dem formulere seg akkurat slik de ville sagt kommandoen på sin dialekt, forklarer Røsok.
I tillegg brukte teknikerne to forskjellig mikrofoner. En i god kvalitet og en på en telefon. Dette var for å simulere lydkvaliteten når man faktisk bruker talestyring.
I etterkant ble alle de muntlige ytringene sammenstilt med ytringer som var skrevet på bokmål og nynorsk, slik at de kan leses av datamaskinene.
Dialektene
Prosjektet deler dialektene i Norge inn i fire store dialektområder: vestnorsk, østnorsk, trøndersk og nordnorsk. I tillegg kommer et femte, mindre område: sørvestnorsk, nærmere bestemt rogalandsdialektene. Disse har trekk som skiller seg fra andre vestlandsdialekter. De fem områdene dekker til sammen mye av variasjonen i språklyder og grammatikk i norske dialekter
Kan være nyttig innen velferd
Per Erik Solberg har vært med å utvikle dialektsettet sammen med Røsok. Han mener det kan være viktig for mennesker med fysiske utfordringer å ruste opp taleassistentene til å forstå oss bedre.
– Nytten av å gjøre taleassistene bedre til å forstå dialekter handler ikke bare om å spille av musikk i bilen. Det kan for eksempel brukes i velferdsteknologi. For eldre brukere, som ikke er like godt vant med å bruke taleassistenter, kan det være viktig at de faktisk blir forstått på dialekten sin, sier Solberg.
Røsok forklarer at det er fullt mulig å legge til helt andre setninger og kommandoer enn det de har laget nå.
– Vi kan også lage datasett der innleserne har eldre stemmer eller som inneholder kommandoer som for eksempel fungerer på døråpnere eller medisindispensere, sier hun.
Hva er Språkbanken ved Nasjonalbiblioteket
Språkbanken er nasjonal infrastruktur for språkteknologi. Det betyr blant annet at de tilbyr ressurser til virksomheter som utvikler språkteknologi. Ressursene bygger i stort grad på den store samlingen av digital tekst fra Nettbiblioteket til Nasjonalbiblioteket.
Viktig språkpolitisk verktøy
Alle de innleste ytringene ligger nå klare for gratis nedlastning på Språkbankens ressursnettsider. Der er det også tilgjengelig for de store tilbyderne av taleassistenter, som Google og Apple.
Men Solberg forklarer at de ikke kan vite om det allerede er tatt i bruk. Teknologiselskapene holder kortene tett til brystet.
– Den eneste måten vi kan finne ut om datasettene blir tatt i bruk, er å følge med og se om taleassistentene blir bedre til å forstå dialekter. Siden denne samlingen med ytringer er laget slik at de kan implementeres direkte, tror vi det er svært gode sjanser for at dette blir en del av verktøykassene til de som leverer taleassistenter, forteller Solberg.
Solberg tror at arbeidet Nasjonalbiblioteket legger ned, ikke er noe de store teknologiselskapene har insentiv eller kompetanse til å gjøre selv.
Å utvikle slike norske ressurser er dermed et viktig språkpolitisk verktøy. De sikrer at taleassistentene fungerer godt på norsk, som i verdenssammenheng er et lite språk.
Artikkelen er sampublisert med forskning.no