13.11.2019
5 min læsetid

Der er ingen model, der passer til alle problemer

Der er ingen enkelt algoritme, der er bedst egnet til ethvert tænkeligt scenarie og datasæt. Det er hovedtanken bag ‘No free lunch’-teoremet.

IDA Learning

afIDA Learning

I machine learning er der et teorem kaldet ‘No free lunch’. Ideen er, at næsten alle maskinindlæringsalgoritmer laver nogle antagelser om forholdet mellem prediktoren og målvariablerne og dermed introducerer bias i modellen.

Det er disse antagelser, der gør, at nogle algoritmer passer bedre til visse datasæt end andre - og omvendt at der er mange datasæt, en given algoritme ikke vil være i stand til at modellere optimalt.

Hvor effektiv en model er, afhænger direkte af, hvor godt modellens antagelser passer til dine data.

Du skal med andre ord bruge din viden om netop dine data og den verden, de lever i, til at vælge den optimale maskinelæringsalgoritme . og så i øvrigt afveje vigtigheden af hastighed, nøjagtighed og kompleksitet for dit problem.

Hvilken ML-metode er den bedste til dine opgaver?

Machine learning er i disse år inde i en kraftig udvikling og der findes efterhånden et stort antal metoder og algoritmer inden for området.

Disse kan overordnet deles op i tre grupper:

  • Supervised learning:
    Hvis du ønsker en funktion, der kan automatisere kategoriseringen af data, og du har et datasæt bestående af eksempler på både input og output, så kan du bruge en supervised learning-algoritme til at bygge en model, der kan løse dette problem.

    Et eksempel på en sådan problemstilling kunne være et spamfilter, som skal kategorisere emails i enten spam eller ikke-spam.
  • Unsupervised learning:
    Har du et datasæt, som du gerne vil danne dig et overblik over, så kan unsupervised learning være en tilgang til eksempelvis at identificere naturlige grupper af datapunkter.

    Et eksempel kunne være en kundedatabase, som man ønsker at opdele i segmenter med lignende præferencer.

  • Reinforcement learning:
    Hvis du har en softwareagent, som kan interagere med et miljø og i den proces indsamle data, så er det muligt at benytte reinforcement learning til at forbedre denne agent.

    Et eksempel på dette kunne være software, der lærer at spille et spil mod menneskelige modstandere.
Kan machine learning hjælpe din virksomhed?

Hvilke opgaver egner sig til machine learning? Lær at forberede dine data og træn en klassifikations-model på IDAs introduktionskursus til machine learning.