XML, eller Extensible Markup Language, har etableret sig som et uundgåeligt format til dataudveksling på nettet. Når du arbejder med store datamængder eller behandler API-svar, vil du ofte støde på XML. I denne tutorial vil jeg vise dig, hvordan du effektivt kan behandle XML-data med Python. Vi vil i slutningen sammen læse en XML-baseret e-handelskatalog og udtrække de indeholdte oplysninger.
Vigtigste indsigter
- XML er et fleksibelt markup-sprog til beskrivelse og strukturering af data.
- Python tilbyder med xml.etree.ElementTree-modulet en enkel måde at behandle XML-data på.
- At læse XML-data kræver forståelse af hierarkikonceptet for knuder og underknuder.
Trin-for-trin vejledning
Trin 1: Forstå XML-data
Først bør du se et eksempel på strukturen af en XML-fil. XML bruger knuder (tags) og attributter til at repræsentere oplysninger.
Her er kataloget af hovedknuden, under hvilken flere produktknuder er arrangeret. Hver produktknude har sine egne børn som ID, navn, pris og lagerbeholdning.

Trin 2: Importer XML-modulet
For at arbejde med XML i Python skal du importere xml.etree.ElementTree-modulet. Dette giver dig mulighed for at læse og manipulere XML-data.
Når du har tilføjet importen i din kode, er du klar til behandling.

Trin 3: Indlæs XML-fil
Nu skal du indlæse XML-filen, der indeholder dataene. Dette gøres med ElementTree-kaldet.
Dette vil læse XML-filen og gemme den som en træstruktur i variablen tree. Nu har du adgang til hele strukturen.
Trin 4: Find hovedknuden
For at kunne arbejde videre har du brug for rodknuden for XML-data, som er afgørende for dit arbejde.
Rod-kunden repræsenterer katalogknuden, som alle andre knuder afhænger af.
Trin 5: Læs produktdata
Nu kan du iterere gennem produktknuderne i en løkke og forespørge de underordnede oplysninger.
Denne kode giver dig alle vigtige oplysninger om hvert produkt i kataloget. Vær opmærksom på, at adgangen til egenskaberne præcist svarer til tag-navnet.
Trin 6: Behandling af attributter (valgfrit)
XML tillader brug af attributter i knuderne. Hvis du f.eks. har et produkt-tag med en attribut, kan du hente det med get-kommandoen.
Dette giver dig ID'en som en attribut.

Trin 7: Formatér output
For at få bedre overblik over output af dataene kan du formatere oplysningerne.
Denne struktur gør det lettere at forstå de udlæste data.

Opsummering – Mestre XML-behandling med Python effektivt
Afslutningsvis har du lært, hvordan du kan læse og behandle XML-data med Python. Du kender nu grundstrukturen af en XML-fil, hvordan du finder centrale knuder og hvordan du effektivt udtrækker de indeholdte oplysninger – alt sammen uundgåeligt for vigtig datamanipulation i Python.
Ofte stillede spørgsmål
Hvordan kan jeg bearbejde XML-data i Python?Du kan bruge xml.etree.ElementTree-modulet til at læse og redigere XML-data.
Kan jeg læse XML-attributter?Ja, med get-kommandoen kan du få adgang til attributter, der er defineret i XML-tags.
Er ElementTree det eneste modul til XML i Python?Der er også andre moduler som minidom og lxml, som tilbyder forskellige funktionaliteter.
Kan jeg selv ændre XML-data?Ja, du kan også modificere XML-data ved at tilføje eller slette knuder.