06.06.2019
4 min læsetid

Kan machine learning hjælpe dig?

De seneste år er det blevet meget lettere at arbejde med machine learning i praksis. Det skyldes bl.a., at computer hardware er blevet hurtigere og billigere, og at data bliver indsamlet og gemt i et hidtil uset omfang.

IDA Learning

af IDA Learning

Maskinlæringsalgoritmer har eksisteret i lang tid, men evnen til automatisk at anvende komplekse matematiske beregninger til store data - igen og igen, hurtigere og hurtigere - det er en relativt ny udvikling.

De voksende mængder af tilgængelige data kombineret med en stadig billigere og mere kraftfuld databehandling samt datalagring, der er til at betale for, betyder nemlig, at det er muligt hurtigt og automatisk at fremstille modeller, der kan analysere større og mere komplekse data og levere hurtigere og mere præcise resultater - selv i meget stor skala.

Og ved at bygge præcise modeller har en organisation en bedre chance for at afdække forbindelser, identificere lønsomme muligheder - eller undgå ukendte risici.

Hvilken metode skal du vælge?


Der er flere forskellige ML-metoder, som har hver deres styrker og svagheder, så det er afgørende, hvad formålet er, når du vælger algoritmer. Ønsker du at klassificere data, eller har du brug for et numerisk output?

Har du en fast struktur i dine data, som ikke kan undværes? Et billede har fx en struktur, hvor det er afgørende, hvilke pixels der er naboer til hinanden, og i en lydfil betyder rækkefølgen over tid noget. Her er en CNN-tilgang (convolutional neural networks) ofte det rigtige valg.

Hvis du har data for patienter og korrekte diagnoser, som du kan lære af, og bruge til at forudsige sygdomme hos andre patienter, vil det være en Supervised Learning Task.

Har du i stedet brug for at samle dine kunder i bestemte kunde-segmenter? Så er det måske tilstrækkeligt at benytte unsupervised learning.

Derudover findes der også et helt felt kaldet reinforcement learning, hvor systemet ikke har brug for en “underviser”, men lærer fra feedback. Et gammelt eksempel er en skakcomputer, som lærer ved at interagere med en menneskelig modspiller. Her får computeren sparsom feedback, som at den har vundet eller tabt, men den får ingen meldinger i forhold til, at det er en dårlig ide at angribe med kongen. Det må computeren selv lære på den hårde måde ved at lave fejlen tilstrækkeligt mange gange.

Et lavpraktisk eksempel er Google Translate. Indtaster du en artikel, får du en tekst tilbage, som i varierende grad er oversat til et valgt sprog. Men du har også mulighed for selv at angive en bedre oversættelse, hvis Google har misforstået brugen af bestemte ord. Her er der tale om supervised learning, hvor du som bruger er med til at gøre systemet bedre.

Kan machine learning hjælpe din virksomhed?

For at få mest muligt ud af maskinindlæring skal du vide, hvordan du parrer de bedste algoritmer med de rigtige værktøjer og processer. Lær at forberede dine data og træn en klassifikationsmodel på IDAs introduktionskursus til machine learning.

 

Har du nok data?


Udover ovenstående er det afgørende for din valg af metode, hvor meget data du har. Nogle metoder fungerer fint med et lille datasæt, men skalerer til gengæld dårligt, og andre metoder kræver et stort datasæt. Og netop datasættet er vigtigt.

For mange virksomheder vil det være arbejdet med infrastrukturen, opsamling og behandling af data, der vil kræve mest tid. Men er fundamentet først på plads, vil en dygtig datalog også kunne give dig gode resultater alene ved at holde sig til gamle og standardiserede metoder fra statistik-verdenen som en baseline og bygge på med mere avancerede algoritmer derfra.

Er dine data klar til at blive brugt?

Lær at indsamle, oprense, lagre, analysere og rapportere dine data – og lær hvordan du skal reagere og handle på baggrund af dem på IDAs kursus Big Data.