IT og digitalisering

Visualiser dine data med Matplotlib

Lær hvordan du kan bruge Matplotlib til at visualisere dine data, fra linjediagrammer til avancerede scatter plots - så du kan præsentere dine analyser på en klar og forståelig måde.

Selv mest entydige data kan være svære at formidle, hvis de ikke er visualiserede på en forståelig måde.

Det er der heldigvis mange værktøjer, der kan hjælpe dig med. Hvis du bruger Python, er Matplotlib nok et af de mest populære valg. Matplotlib er et Python-bibliotek, der gør det muligt at skabe en bred vifte af visualiseringer – fra simple linjediagrammer til komplekse 3D-grafer.

Hvordan fungerer Matplotlib?

Matplotlib fungerer ved at oprette figures og axes, hvor hver figur kan indeholde flere diagrammer. Du skriver kode i sektioner og kører dem individuelt, hvilket gør det nemt at justere og teste visualiseringer løbende. 

Dette giver dig mulighed for hurtigt at eksperimentere med forskellige visualiseringer og få øjeblikkelig feedback på, hvordan ændringer i koden påvirker resultaterne.

En simpel måde at bruge Matplotlib på er at oprette et linjediagram, hvor du kan visualisere, hvordan data ændrer sig over tid eller mellem brugerdefinerede intervaller.

Trin-for-trin guide til at bruge Matplotlib

  1. Importér Matplotlib:
    Først skal du importere Matplotlib i dit Python-script:

import matplotlib.pyplot as plt

MIDLERTIDIG ILLUSTRATION

2. Forbered dine data:
Indlæs dine data, fx ved hjælp af Pandas, et Python-bibliotek, der er specielt designet til at håndtere og manipulere strukturerede data. Pandas gør det muligt at læse data fra forskellige kilder som CSV-filer, databaser eller Excel-filer, og konvertere dem til et format, der kan bruges til visualisering og analyse. 

Sørg for, at dataene er i det rette format, så de kan plottes. Du kan f.eks. bruge DataFrame-objektet fra Pandas til at organisere dine data i rækker og kolonner.
Opret en visualisering: Brug Matplotlib’s plot()-funktion til at skabe et diagram. Du kan plotte linjediagrammer, scatter plots og andre diagrammer, afhængig af dine behov.

import pandas as pd

data = pd.read_csv('data.csv')

x = data['column_x']

y = data['column_y']

MIDLERTIDIG ILLUSTRATION

3. Opret en visualisering: Brug Matplotlib’s plot()-funktion til at skabe et diagram. Du kan plotte linjediagrammer, scatter plots og andre diagrammer, afhængig af dine behov.

Eksempel på linjediagram:

plt.xlabel('X-værdi')

plt.xlabel('Y-værdi')

plt.title('Mit Linjediagram')

plt.plot(x, y, color='green', linestyle='--')

MIDLERTIDIG ILLUSTRATION

4. Tilpas visualiseringen: Du kan tilføje etiketter, titel og tilpasse udseendet af grafen. For eksempel kan du tilføje akseetiketter, en titel og ændre linjefarven.

Eksempel:

plt.plot(x, y)

MIDLERTIDIG ILLUSTRATION

5. Vis visualiseringen: Når du har oprettet og tilpasset din grafik, bruger du show()-funktionen til at vise den. Dette åbner et vindue med din graf.

MIDLERTIDIG ILLUSTRATION

plt.show()

6. Gem visualiseringen: Du kan også gemme visualiseringen som en fil (f.eks. PNG eller PDF) for at bruge den i rapporter eller præsentationer.

plt.savefig('mit_diagram.png')

MIDLERTIDIG ILLUSTRATION

Avancerede visualiseringer med Matplotlib

Matplotlib kan naturligvis også bruges til langt mere komplekse visualiseringer end simple linjediagrammer. Det understøtter en lang række forskellige grafiske præsentationer, og giver dig næsten ubegrænset kontrol over, hvordan visualiseringerne ser ud, så du kan tilpasse dem til dine præcise behov – fra farver og layout til etiketter og brugertilpasning af akser.

Her er nogle af de mere avancerede visualiseringer, du kan lave med Matplotlib:

Scatter Plots (Punktdiagrammer)

Scatter plots er ideelle til at visualisere relationen mellem to numeriske variabler. Matplotlib giver dig mulighed for at oprette scatter plots med forskellige farver, størrelser og former på punkterne, hvilket gør det muligt at fremhæve bestemte mønstre i dataene.

plt.scatter(x, y, color='red', s=100, alpha=0.5)

plt.show()

Histogrammer

Histogrammer bruges til at vise fordelingen af en variabel. Matplotlib giver dig mulighed for at oprette tilpassede histogrammer, hvor du kan justere antallet af "bins" (søjler), farver og grænser.

plt.hist(data, bins=20, color='blue', alpha=0.7)

plt.show()

Box Plots (Boksdiagrammer)

Box plots bruges til at vise fordelingen af data og opdage outliers. Dette er særligt nyttigt i statistisk analyse, hvor du hurtigt kan få indsigt i medianen, kvartilerne og potentielle ekstreme værdier i dit datasæt.

plt.boxplot(data)

plt.show()

Subplots (Flere diagrammer på én figur)

Matplotlib giver dig mulighed for at vise flere diagrammer i én figur (den grafiske repræsentation) ved hjælp af subplots. Dette er nyttigt, når du vil sammenligne flere visualiseringer på samme tid.

fig, axs = plt.subplots(2,2)

axs[0, 0].plot(x, y)

axs[0, 0].scatter(x, y)

axs[0, 0].hist(data, bins=20)

axs[0, 0].boxplot(data)

plt.show()

3D Plotting

Matplotlib understøtter også 3D-visualiseringer, som giver dig mulighed for at vise komplekse datasæt i tre dimensioner. Dette er nyttigt, når du arbejder med data, der har flere variabler og ønsker at visualisere relationer i 3D.

from mpl_toolkits.mplot3d import Axes3D

fig = plt.figure()

ax =fig.add_subplot(111, projection='3d')

ax.scatter(x, y, z)

plt.show()

Heatmaps

Heatmaps bruges til at visualisere matrixdata eller fordelingen af værdier i et 2D-gitter. Dette er nyttigt til at vise mønstre og tendenser i store datasæt, f.eks. i forbindelse med korrelationsmatricer.

import numphy as np

data = np.random.rand(10, 10)

plt.imshow(data, cmaps='hot', interpolations='nearest')

plt.colorbar()

plt.show()

PS: Har du brug for at udvide dine visualiseringer? Matplotlib fungerer godt sammen med andre Python-biblioteker som Pandas og SciPy, hvilket gør det let at integrere i større dataanalyse-pipelines. Så kan du arbejde med store datasæt og udføre statistiske analyser, samtidig med at du kan visualisere dine resultater direkte.

Lær at bruge Matplotlib med Data science med Python

Kursus

Data Science med Python

Lær hvordan du forbereder og udleder resultater fra data med Python på bare 3 dage. Brug Python til at bearbejde og visualisere data effektivt, forstå de basale principper ved data science og opbyg simple prædiktive modeller med Python.

Kursus

Data Science med Python

Lær hvordan du forbereder og udleder resultater fra data med Python på bare 3 dage. Brug Python til at bearbejde og visualisere data effektivt, forstå de basale principper ved data science og opbyg simple prædiktive modeller med Python.

Læs mere:

Tema

IT og digitalisering

Se IDAs tilbud IT-arkitektur, cybersikkerhed, UX, UI, AI og machine learning, programmering og softwareudvikling, datascience, compliance og datasikkerhed.

Tema

Kursusoversigt

Få adgang til et bredt udvalg af kurser hos IDA, skræddersyet til STEM-uddannede. Sikr din markedsværdi og udvikl dine kompetencer hele karrieren

Kontakt

Få hjælp nu

Find relevante, kvalitetssikrede kurser og efteruddannelse.