Da inzwischen die nötigen XPath Ausdrücke bekannt sind, muss der HTML Scraper des Article Wizards geöffnet werden. Wie das in der Beta-Version funktioniert, findet ihr im Unterpunkt Freischaltung des Scrapers. Dort werden nun die URL und die oben ermittelten Ausdrücke eingetragen. Der Index wird auf „-1“ belassen, da jedes Element extrahiert werden soll und die Extraktionsmethode selbst ist „XPath“. Insgesamt sieht das dann so wie im folgenden Screenshot aus:
Das Ziel ist es also, alle Stadtnamen von der Tabelle unter http://de.wikipedia.org/wiki/Liste_der_Gro%C3%9Fst%C3%A4dte_in_Deutschland#Aktuelle_Gro.C3.9Fst.C3.A4dte zu extrahieren. Dazu benötigen wir zunächst einmal den entsprechenden XPath-Ausdruck, den wir mit dem Firebug Addon FirePath bekommen, indem wir auf den ersten Stadtnamen mit der rechten Maustaste klicken und im erscheinenden Kontextmenü den Punkt „Inspect in FirePath“ auswählen. Die folgende Abbildung verdeutlicht das:
×