„Wir benötigen fortlaufend neue Inhalte für unsere Hauptwebseite und müssen diese Texte effizient und mit geringstmöglichem Aufwand erstellen können. Mit dem ArticleSpinningWizard ist uns dies auf sehr einfache Weise möglich. Aufgrund der Vielzahl an tollen Funktionen muss man sich aber schon etwas damit beschäftigen, um diese Möglichkeiten auch nutzen zu können.“
Das war’s eigentlich schon. Statt einer halben Stunde Copy & Paste habe ich die komplette Liste in wenigen Sekunden heruntergeladen. Ich kann die Werte nun als CSV-Datei extrahieren oder direkt als Datenbasis für die Variablenfunktion des Article Wizards verwenden. Ich bin an dieser Stelle bereits soweit, dass ich meinen gespinnten Artikel auf jede einzelnen Stadt optimieren kann. Aber vorerst exportiere ich die Ergebnisse des Scrapens als CSV Datei. We’re not done yet.

Das Ziel ist es also, alle Stadtnamen von der Tabelle unter http://de.wikipedia.org/wiki/Liste_der_Gro%C3%9Fst%C3%A4dte_in_Deutschland#Aktuelle_Gro.C3.9Fst.C3.A4dte zu extrahieren. Dazu benötigen wir zunächst einmal den entsprechenden XPath-Ausdruck, den wir mit dem Firebug Addon FirePath bekommen, indem wir auf den ersten Stadtnamen mit der rechten Maustaste klicken und im erscheinenden Kontextmenü den Punkt „Inspect in FirePath“ auswählen. Die folgende Abbildung verdeutlicht das:

×