Inzwischen haben wir von jeder Stadt neben dem Namen auch noch einen auf die Stadt zugeschnittenen Beschreibungstext, das Stadtwappen und die Einwohnerzahl. Theoretisch könnten wir jetzt die Landing Pages generieren. Praktisch ist es aber leider so, dass sich in dem von Wikipedia gescrapten Einleitungstext noch relativ viele interne Links verbergen. Deshalb werden die gescrapten Daten zunächst wieder als CSV Datei exportiert und „bereinigt“.
Veja mais: rewrite article make unique, spinning, rewriting article, Article Rewriting, article around 500 words, rewrite article english english, word phrase spinning, spinning article, article word syntax, syntax english article, articles syntax english, pay rewriting, can rewrite article, article english important 500 words, english important article 500 words, article english important, article rewriting pay, word rewriting, articles syntax, spinning articles unique
Das Ziel ist es also, alle Stadtnamen von der Tabelle unter http://de.wikipedia.org/wiki/Liste_der_Gro%C3%9Fst%C3%A4dte_in_Deutschland#Aktuelle_Gro.C3.9Fst.C3.A4dte zu extrahieren. Dazu benötigen wir zunächst einmal den entsprechenden XPath-Ausdruck, den wir mit dem Firebug Addon FirePath bekommen, indem wir auf den ersten Stadtnamen mit der rechten Maustaste klicken und im erscheinenden Kontextmenü den Punkt „Inspect in FirePath“ auswählen. Die folgende Abbildung verdeutlicht das:
×