Leider handelt es sich bei den vorliegenden URLs um relative URLs, deshalb kann ich sie nicht direkt weiterverwenden sondern muss sie zuerst in absolute URLs umwandeln. Dazu kann Microsoft Excel verwendet werden, indem einfach mit der Funktion „Verketten“ der fehlende Teil der URL („http://de.wikipedia.org“) ergänzt wird. Wie das im Detail funktioniert, demonstriert der folgende Screenshot:


One of the the most popular offerings we have available at this time is our email copywriting service. It’s something that we have been continually contacted about since so many business owners lack the time to produce the kind of email copy that entices their customers and encourages better brand loyalty. Fortunately, our team of email copywriters are all extremely talented when it comes to producing quality copy and will stop at nothing to ensure the content they produce for you reads well and represents your brand in the best way possible.
Das Ziel ist es also, alle Stadtnamen von der Tabelle unter http://de.wikipedia.org/wiki/Liste_der_Gro%C3%9Fst%C3%A4dte_in_Deutschland#Aktuelle_Gro.C3.9Fst.C3.A4dte zu extrahieren. Dazu benötigen wir zunächst einmal den entsprechenden XPath-Ausdruck, den wir mit dem Firebug Addon FirePath bekommen, indem wir auf den ersten Stadtnamen mit der rechten Maustaste klicken und im erscheinenden Kontextmenü den Punkt „Inspect in FirePath“ auswählen. Die folgende Abbildung verdeutlicht das:
×