Driving AI
Siri taler ikke sønderjysk: Projekt vil løfte danske taletenologi

Når det gælder taleteknologi, er vi i Danmark udfordret af vores størrelse.
Vi er for lille et sprogområde til, at virksomheder vil investere i at optimere dansk taleteknologi. Og samtidig er vi store nok til at have dialekter som sønderjysk og bornholmsk, der er svære at forstå i resten af landet.
Det er en af forklaringerne på, at det ofte er en frustrerende oplevelse at tale til Siri, og til at det store potentiale i taleteknologi ikke er blevet udnyttet i højere grad endnu.
For at løse problemet har Innovationsfonden skudt 14 millioner kroner i projektet CoRal – Danish Conversational and Read-aloud Speech Dataset – der netop er færdiggjort.
CoRal-projektet har opbygget et taledatasæt på næsten 1000 timer baseret på optagelser af et bredt udsnit af befolkningen samt en række talegenkendelsesmodeller, der ligger frit tilgængelige som open source.
”Det er et projekt, der har et forretningsmæssigt perspektiv idet målet er, at danske virksomheder skal kunne bruge det her datasæt til at producere gode løsninger, som vi blandt andet kan bruge i den offentlige sektor i Danmark”, fortæller Torben Blach, der er seniorprogramleder på Alexandra-instituttet, og som har ledet CoRal-projektet.
”Men der er også et demokratisk element i projektet, der skal sikre, at taleteknologi bliver tilgængeligt for alle danskere – også dem der taler med en dialekt, har accent eller er oppe i årene”.
Blandede erfaringer med taleteknologi
Taleteknologi er allerede udbredt til flere steder i den offentlige sektor, men med varierende succes.
Et nyt studie fra Københavns Universitet viser, at lægerne spilder dyrebar arbejdstid på at rette teksten i journaler, som de har dikteret ved hjælp af taleteknologi. Og Torben Blach peger på, at kommuner i både Sønderjylland og Vestjylland har måttet droppe omstillingssystemer, der var baseret på taleteknologi, fordi den ikke forstod borgere med taleudfordringer eller stærk dialekt.
Ifølge Torben Blach kan de mange udfordringer hænge sammen med, at de mest udbredte løsninger – der typisk er amerikanske-, er baseret på mangelfulde datasæt.
”Når de udenlandske techgiganter skal udvikle teknologien, er målet at ramme flest muligt, og så får de ikke de mindre segmenter med”.
”De bruger først og fremmest offentligt tilgængelige optagelser, og så får de måske et bureau til at hyre en lille gruppe danskere, der kan oplæse en masse tekster. Men hvis de alle sammen taler rigsdansk, så bliver resultatet, at teknologien kun kan genkende en mindre del af, hvad der bliver sagt”, forklarer Torben Blach.
Han peger på, at sundhedssektoren er særlig udfordret, fordi en stor del af de ansatte er født i udlandet.
”Det gælder både læger, sygeplejersker og SOSU-assistenter, og de kommer fra hele verden, så det er klart, at de taler med accent, og det bliver et problem, når de skal journalisere på dansk”.
1000 timers optagelser
For at skabe et datasæt, der rummer så meget af diversiteten i det danske sprog som muligt, har CoRal-projektet derfor lavet optagelser af danskere på tværs af køn, alder og etnicitet i hele landet.
”Vi har 30-40 dialekter i Danmark, som vi skar ned til syv dialektområder med særligt fokus på de kraftigste dialekter, der kan være sværest at forstå”.
”I hver af de områder rekrutterede vi lokale borgere i samarbejde med bibliotekerne, og så satte vi optageudstyr op. For at indsamle datasættet fik vi borgerne til at læse op fra nogle tekster, men derudover satte vi dem også sammen to og to og fik dem til at tale sammen om nogle udvalgte emner, så vi på den måde fik noget mere naturlig samtale”, forklarer Torben Blach.
Ifølge ham er det offentligt tilgængelige taledatasæt det vigtigste resultat af projektet, men CoRal har også udviklet en række modeller, der kan forstå tale og omsætte det til tekst, og en model som kan læse tekster højt for brugeren.
”Vi kan se, at de allerede er blevet downloadet flittigt, og lige nu er de formentlig også de bedste modeller i Danmark, men de er Open Source, så inden for kort tid vil andre forhåbentlig have videreudviklet dem og gjort dem endnu bedre”.

Driving AI
Hør mere om dansk taleteknologi
På Driving AI kan du møde iværksættere, erhvervsfolk og forskere, der alle er førende inden for brugen af AI.

Driving AI
Hør mere om dansk taleteknologi
På Driving AI kan du møde iværksættere, erhvervsfolk og forskere, der alle er førende inden for brugen af AI.
Læs mere:
Kontakt
Ring eller skriv til IDA
Har du brug for rådgivning eller hjælp til dit medlemskab?