Article spinning is a specific writing technique used in search engine optimization (SEO) and in other applications. Website authors may use article spinning on their own sites to reduce the similarity ratio of rather redundant pages or pages with thin content. Content spinning works by rewriting existing articles, or parts of articles, and replacing specific words, phrases, sentences, or even entire paragraphs with any number of alternate versions to provide a slightly different variation with each spin. This process can be completely automated or written manually as many times as needed.

Article Spinning wird einerseits für den Bereich Linkmarketing genutzt, andererseits für die Erstellung von Texten für Landingpages oder Produktseiten. Im Linkmarketing können damit z.B. Texte für Presseportale, Free Blogs oder Bookmarks erstellt werden. Spin-Texte für Landing-Pages finden z.B. oft bei Portalen Anwendung, die ähnlichen Content für mehrere Städte benötigen, wie z.B. Gutschein-Portale, Job-Portale, oder Lieferdienst-Portale.

Bisher haben wir lediglich eine Liste mit Stadtnamen extrahiert. In jedem einzelnen Artikel steht aber immernoch genau der selbe Inhalt. Klar, der Text ist gespinnt und damit auch „unique“ im Sinne von Google, aber ich wäre trotzdem vorsichtig, zu viele Artikel aus dem gleichen gespinnten Ausgangstext auf ein und der selben Domain zu hosten. Schließlich kann man nicht ausschließen, dass Google in Zukunft einen entsprechenden Filter einführt, der die Unterseiten der gleichen Domain noch genauer hinsichtlich Duplicate Content prüft.


Das Ziel ist es also, alle Stadtnamen von der Tabelle unter http://de.wikipedia.org/wiki/Liste_der_Gro%C3%9Fst%C3%A4dte_in_Deutschland#Aktuelle_Gro.C3.9Fst.C3.A4dte zu extrahieren. Dazu benötigen wir zunächst einmal den entsprechenden XPath-Ausdruck, den wir mit dem Firebug Addon FirePath bekommen, indem wir auf den ersten Stadtnamen mit der rechten Maustaste klicken und im erscheinenden Kontextmenü den Punkt „Inspect in FirePath“ auswählen. Die folgende Abbildung verdeutlicht das:
×