13.11.2019
4 min læsetid

Få styr på Python (så du kan fokusere på din data science)

Python er et af de mest populære programmeringssprog, også når det kommer til machine learning. Det skyldes, at det er nemt at bruge, kraftfuldt og alsidigt - og så har det omfattende biblioteker til videnskabelig, statistisk og numerisk beregning.

IDA Learning

af IDA Learning

Python er hastigt ved at blive et af de mest udbredte programmeringssprog, og det er der mange gode grunde til. Python er nemlig:

  • begyndervenligt:
    Python er specifikt designet til at være læsevenlig, og både det visuelle udtryk og syntaxen er relativ enkel sammenlignet med fx Java og C++. Det betyder, du kan fokusere på programmeringskoncepterne i stedet for først at lære og forstå en indviklet syntaks.

  • fleksibelt:
    Fordi Python er et dynamisk skrevet sprog, er det meget fleksibelt. Der er ikke er strenge regler for, hvordan du opbygger funktioner - og du kan bruge forskellige metoder til at løse givne problemer. Derudover er Python også relativt tilgivende for fejl, så du kan stadig kompilere og køre dit program, indtil du rammer den del af dit program, der skaber problemer.

  • produktivt:
    Syntaksen i Python gør, at du kan programmere i færre trin end ved andre programmeringssprog. Stærke procesintegrationsfunktioner, enhedstestrammer og forbedrede kontrolfunktioner bidrager alle til en øget hastighed, og der er gode muligheder for at opbygge skalerbare multi-protokol-netværksapplikationer.

  • og har omfattende support-biblioteker:
    Der findes store og fremragende standardbiblioteker, der indeholder alt fra strengoperationer, internet, webserviceværktøjer til operativsystem-interfaces og protokoller. Du kan finde mange af de meget brugte programmeringsopgaver her og behøver altså ikke at kode det hele fra bunden
Vil du i gang med machine learning?

Kan machine learning hjælpe din virksomhed?

Lær at forberede dine data og træn en klassifikationsmodel på IDAs introduktionskursus til machine learning.

Især inden for data science og machine learning er Python meget udbredt. Ovenstående betyder nemlig, at du kan fokusere på at løse dit specifikke ML-problem i stedet for at skulle fortabe dig i de komplekse, bagvedliggende algoritmer.

Der er en række målrettede ML-biblioteker, hvoraf det mest udbredte er scikit-learn. Det implementerer en bred vifte af maskinlæringsalgoritmer og gør det nemt at slutte dem til egentlige applikationer. Du kan bruge en hel række funktioner her som regression, clustering, modelvalg, forbehandling, klassificering og meget mere.

Scikit-learn bygger på en pakke af Python-baseret open source software, kaldet SciPy (Scientific Python), som du skal installere, før du kan bruge scikit.

I scikit-learn finder du også færdige datasæt, du kan arbejde med - f.eks. det berømte Iris datasæt. Det er måske den mest kendte multivariate database om mønstergenkendelse, og bliver derfor ofte brugt til at træne machine learning.

I hverdagen vil du selvfølgelig sjældent have færdige datasæt til rådighed. Typisk skal du bruge en god del af din tid på datavask, inden du overhovedet kan komme i gang. Her kan du fx bruge pandas, et open source dataanalyse- og modelleringsbibliotek med brugervenlige datastrukturer og dataanalyseværktøjer til Python, eller udvidelsesmodulet NumPy (Numerical Python), der tilbyder hurtige, forkompilerede funktioner til numeriske rutiner.

Lær at programmere i Python

Har du de rigtige værktøjer til at arbejde med komplekse modeller og dataanalyse? Lær at udvikle applikationer i Python og bliv klædt på til domænespecifikke opgaver.