XML, või laiendatav märgistuskeel, on end tõestanud kui hädavajalik formaat andmevahetuseks veebis. Kui töötad suurte andmehulkadega või töötled API vastuseid, kohtad tihti XML-i. Selles õpetuses näitan, kuidas Python abil tõhusalt XML-andmeid töödelda. Lõpus loeme koos XML-põhise e-kaubanduse katalooge ja ekstraktime sealt sisalduvad andmed.
Olulised järeldused
- XML on paindlik märgistuskeel andmete kirjeldamiseks ja struktureerimiseks.
- Python pakub xml.etree.ElementTree mooduli kaudu lihtsat viisi XML-andmete töötlemiseks.
- XML-andmete lugemine nõuab sõlmede ja alamsõlmede hierarhia mõistmist.
Samm-sammult juhend
Samm 1: XML-andmete mõistmine
Esialgu peaksid vaatama XML-faili struktuuri näidet. XML kasutab sõlmi (siltide) ja atribuute teabe esitamiseks.
Siin on peamine sõlm, mille all on mitmed toote sõlmed korraldatud. Igal toote sõlmel on oma alamsõlmed, nagu ID, nimi, hind ja varu.

Samm 2: XML-mooduli importimine
Kuna soovid Pythonis XML-iga töötada, pead importima xml.etree.ElementTree mooduli. See võimaldab sul XML-andmeid lugeda ja manipuleerida.
Pärast impordilauset oma koodile lisamist oled valmis töötlemiseks.

Samm 3: XML-faili lugemine
Nüüd pead lugema XML-faili, mis sisaldab andmeid. Seda tehakse ElementTree lähenemise kaudu.
Sellega loetakse XML-fail ja salvestatakse puustruktuurina tree muutujasse. Nüüd on sul juurdepääs kogu struktuurile.
Samm 4: Peasõlme leidmine
Edasi minemiseks vajad XML-andmete juursõlme, mis on sinu töö jaoks ülioluline.
Root esindab sõlme Kataloog, millest kõik muud sõlmed sõltuvad.
Samm 5: Tooteandmete lugemine
Nüüd saad iteratsiooniks läbida toote sõlmed ja küsida lapseandmeid.
See kood tagastab sulle kõik olulised andmed iga toote kohta kataloogis. Veendu, et juurdepääs omadustele vastab täpselt sildinimele.
Samm 6: Atribuutide töötlemine (valikuline)
XML lubab sõlmedes atribuutide kasutamist. Näiteks kui sul on toote silt koos atribuudi, saad selle kätte get käsu abil.
See tagastab ID kui atribuut.

Samm 7: Väljundi vormindamine
Andmete väljundi parema ülevaate saamiseks saad vormindada teavet.
See struktuur muudab lugemise andmete lugemise lihtsamaks.

Kokkuvõte – XML-andmete töötlemine Pythoniga tõhusalt
Kokkuvõtteks oled õppinud, kuidas lugeda ja töödelda XML-andmeid Pythonis. Sa tead nüüd XML-faili põhistruktuuri, kuidas leida keskseid sõlmi ja kuidas tõhusalt ekstraktida seal olevaid andmeid – kõik vajalik oluliste andmete manipuleerimiseks Pythonis.
Korduma kippuvad küsimused
Kuidas saan XML-andmeid Pythonis töödelda?Sa saad kasutada moodulit xml.etree.ElementTree, et lugeda ja töötada XML-andmetega.
Kas ma saan XML-atribuutide lugeda?Jah, get käsuga saad ligi XML-siltides määratud atribuutidele.
Kas ElementTree on ainus moodul XML-i jaoks Pythonis?On ka teisi mooduleid nagu minidom ja lxml, mis pakuvad erinevaid funktsioone.
Kas ma saan XML-andmeid ise muuta?Jah, saad ka muuta XML-andmeid, lisades või eemaldades sõlmi.