Bei der Preissuchmaschine auspreiser.de werden die Preise innerhalb weniger Minuten aktualisiert, sobald der Händler darüber informiert hat. Der Zeitpunkt der letzten Aktualisierung steht unter dem Preis. Wird der Shop zu einem späteren Zeitpunkt besucht, können die angegebenen Preise sowie die Rangfolge der Produkte wegen zwischenzeitlichen Preiserhöhungen veraltet sein. Daher kann es gelegentlich vorkommen, dass die angebotenen Artikel nicht zu dem auf auspreiser.de angegebenen Preis erhältlich sind.

Article spinning can use a variety of methods; a straightforward one is "spintax". Spintax (or spin syntax) uses a marked-up version of text to indicate which parts of the text should be altered or rearranged. The different variants of one paragraph, one or several sentences, or groups of words or words are marked. This spintax can be extremely rich and complex, with lots of depth levels (nested spinning). It acts as a tree with large branches, then lots of smaller branches up to the leaves. To create readable articles out of spintax, a specific software application chooses any of the possible paths in the tree; this results in wide variations of the base article without significant alteration to its meaning.


Inzwischen haben wir von jeder Stadt neben dem Namen auch noch einen auf die Stadt zugeschnittenen Beschreibungstext, das Stadtwappen und die Einwohnerzahl. Theoretisch könnten wir jetzt die Landing Pages generieren. Praktisch ist es aber leider so, dass sich in dem von Wikipedia gescrapten Einleitungstext noch relativ viele interne Links verbergen. Deshalb werden die gescrapten Daten zunächst wieder als CSV Datei exportiert und „bereinigt“.
Read as much as you can on the topic. Visit your local library. Consult books, magazine articles, published interviews, and online features as well as news sources, blogs, and databases for information. A good place to start looking for data not readily apparent on the Internet is the Gale Directory of Databases, which exists in both book format (available in libraries) or online.
Das Ziel ist es also, alle Stadtnamen von der Tabelle unter http://de.wikipedia.org/wiki/Liste_der_Gro%C3%9Fst%C3%A4dte_in_Deutschland#Aktuelle_Gro.C3.9Fst.C3.A4dte zu extrahieren. Dazu benötigen wir zunächst einmal den entsprechenden XPath-Ausdruck, den wir mit dem Firebug Addon FirePath bekommen, indem wir auf den ersten Stadtnamen mit der rechten Maustaste klicken und im erscheinenden Kontextmenü den Punkt „Inspect in FirePath“ auswählen. Die folgende Abbildung verdeutlicht das:
×