from xml.dom import minidom doc = minidom.parse("tei1.xml") # Määran tekstifaili, kust soovin infot lugeda # Otsin infot teksti pealkirja kohta. print(doc.getElementsByTagName("title")[0].firstChild.nodeValue) ## Ülesanne: küsi märgendatud failist välja teksti kirjastaja ja ilmumiskoht. # Ilmumisaja kuvamine on veidi keerukam dates = doc.getElementsByTagName("date") for date in dates: print(date.getAttribute("when")) # Funktsioon sisuteksti lugemiseks def getText(nodelist): text = [] for node in nodelist: if node.nodeType == node.TEXT_NODE: text.append(node.data) else: text.append(getText(node.childNodes)) return "".join(text) # Koostan loendi sisuteksti alajaotustest nodelist = doc.getElementsByTagName("text") # Kasutan ülal defineeritud funktsiooni, mis tagastab tekstiosa alajaotused sidusa tervikuna for node in nodelist: print(getText(node.childNodes).lstrip())