Alexandra Instituttet

I takt med at taleteknologi bliver en integreret del af samfundet, er behovet for en digital infrastruktur, der mestrer det danske sprog, blevet kritisk. Projekt CoRal har opbygget et af landets mest omfattende open-source taledatasæt med op imod 1000 timers lyd fordelt på mere end 1100 forskellige stemmer og 30 dialekter. Projektet dækker hele værdikæden fra dataindsamling til modeludvikling. Oplægget præsenterer erfaringerne fra indsamlingen af de 400.000 ytringer og de tekniske resultater ved at træne modeller på specifikt dansk hverdagssprog. Vi deler konkrete konklusioner på, hvordan frit tilgængelige data og modeller kan accelerere innovation og skabe vækst i både den private og offentlige sektor.
Bio: Torben Blach er Sr. Program leder på Alexandra Instituttet, og leder aktiviteterne inden for udvikling af dansk sprogteknologi. Ud over CoRal er Torben tilknyttet projekterne Danish Foundation Models, Dansk Sprogmodel Konsortium og EU projektet TrustLLM.