IT og digitalisering
Få styr på Python (så du kan fokusere på din data science)
Python er hastigt ved at blive et af de mest udbredte programmeringssprog, og det er der mange gode grunde til. Python er nemlig:
- begyndervenligt: Python er specifikt designet til at være læsevenlig, og både det visuelle udtryk og syntaxen er relativ enkel sammenlignet med fx Java og C++. Det betyder, du kan fokusere på programmeringskoncepterne i stedet for først at lære og forstå en indviklet syntaks.
- fleksibelt: Fordi Python er et dynamisk skrevet sprog, er det meget fleksibelt. Der er ikke er strenge regler for, hvordan du opbygger funktioner - og du kan bruge forskellige metoder til at løse givne problemer. Derudover er Python også relativt tilgivende for fejl, så du kan stadig kompilere og køre dit program, indtil du rammer den del af dit program, der skaber problemer.
- produktivt: Syntaksen i Python gør, at du kan programmere i færre trin end ved andre programmeringssprog. Stærke procesintegrationsfunktioner, enhedstestrammer og forbedrede kontrolfunktioner bidrager alle til en øget hastighed, og der er gode muligheder for at opbygge skalerbare multi-protokol-netværksapplikationer.
- og har omfattende support-biblioteker: Der findes store og fremragende standardbiblioteker, der indeholder alt fra strengoperationer, internet, webserviceværktøjer til operativsystem-interfaces og protokoller. Du kan finde mange af de meget brugte programmeringsopgaver her og behøver altså ikke at kode det hele fra bunden
Især inden for data science og machine learning er Python meget udbredt. Ovenstående betyder nemlig, at du kan fokusere på at løse dit specifikke ML-problem i stedet for at skulle fortabe dig i de komplekse, bagvedliggende algoritmer.
Der er en række målrettede ML-biblioteker, hvoraf det mest udbredte er scikit-learn. Det implementerer en bred vifte af maskinlæringsalgoritmer og gør det nemt at slutte dem til egentlige applikationer. Du kan bruge en hel række funktioner her som regression, clustering, modelvalg, forbehandling, klassificering og meget mere.
Scikit-learn bygger på en pakke af Python-baseret open source software, kaldet SciPy (Scientific Python), som du skal installere, før du kan bruge scikit.
I scikit-learn finder du også færdige datasæt, du kan arbejde med - f.eks. det berømte Iris datasæt. Det er måske den mest kendte multivariate database om mønstergenkendelse, og bliver derfor ofte brugt til at træne machine learning.
I hverdagen vil du selvfølgelig sjældent have færdige datasæt til rådighed. Typisk skal du bruge en god del af din tid på datavask, inden du overhovedet kan komme i gang. Her kan du fx bruge pandas, et open source dataanalyse- og modelleringsbibliotek med brugervenlige datastrukturer og dataanalyseværktøjer til Python, eller udvidelsesmodulet NumPy (Numerical Python), der tilbyder hurtige, forkompilerede funktioner til numeriske rutiner.
Læs mere:
Kontakt
Få hjælp nu
Find relevante, kvalitetssikrede kurser og efteruddannelse.