Scraping kann generell etwas tricky sein und FirePath ist eigentlich nur dann wirklich sinnvoll, wenn im Quelltext id-Attribute verwendet werden. Ansonsten ist der Pfad meist elendig lang und kann unter Umständen vom Scraper nicht richtig erkannt werden. Meist macht es dann mehr Sinn, den XPath selbst zu definieren (geht zum Beispiel über class Attribut häufig sehr gut). Das ist allerdings ein Kapitel für sich
Mithilfe von spezieller Spinning Software, sogenannten Article Spinnern oder Text Spinnern, kann die Synonymfindung automatisiert werden. Die Software hilft außerdem dabei, die Einzigartigkeit der neu entstandenen Texte zu bewerten. Grundlage der Spinning-Software bilden umfangreiche Synonym-Datenbanken. Ein Beispiel ist z.B. der Article Spinning Wizard.
For example, if you are writing about how one person learns how to read organic labels, your overall argument might be that the public needs to be aware that many companies misuse organic labeling. This leads to dishonest practices in product advertising. Another topic might be: it’s important to know who owns your local media outlets. If corporate media organizations own your local newspaper, you may get very little media coverage of your area and not know much about your own community.
Das Ziel ist es also, alle Stadtnamen von der Tabelle unter http://de.wikipedia.org/wiki/Liste_der_Gro%C3%9Fst%C3%A4dte_in_Deutschland#Aktuelle_Gro.C3.9Fst.C3.A4dte zu extrahieren. Dazu benötigen wir zunächst einmal den entsprechenden XPath-Ausdruck, den wir mit dem Firebug Addon FirePath bekommen, indem wir auf den ersten Stadtnamen mit der rechten Maustaste klicken und im erscheinenden Kontextmenü den Punkt „Inspect in FirePath“ auswählen. Die folgende Abbildung verdeutlicht das:
Ich möchte also jedem einzelnen Artikel noch eine möglichst individuelle Note (sprich einen Teil individuellen Textes) verpassen. Dazu kann ich entweder jeden Artikel manuell editieren – was ziemlich zeitaufwendig wäre – oder ich mache mir erneut die Power des Scrapens zu Nutze. Wie ich bereits weiter oben schrieb, bietet Wikipedia zu jeder Stadt eine eigene Detailseite an. In weiser Voraussicht habe ich sogar schon die entsprechenden URLs zuvor mitgescraped, also schauen wir uns die Sache mal genauer an.
Das simple Ersetzen von einzelnen Wörtern reicht heutzutage nicht mehr aus, um einen Artikel mit genügend Einzigartigkeit zu versehen, um dem Duplicate Content Filter von Google zu entgehen. Deshalb unterstützt der Article Wizard das Article Spinning in beliebiger Tiefe. Sie können zum Beispiel innerhalb eines Artikels synonyme Absätze haben, die wiederum synonyme Sätze beinhalten, die wiederum synonyme Wörter beinhalten. Dadurch erhöhen Sie die Einzigartigkeit Ihrer Artikel enorm!

Mit der Hilfe dieses Tools und in Zusammenarbeit mit unseren Textern und Technikern konnten wir ein umfangreiches Webportal mit content versorgen und etablieren. Das Portal wird von Google und den Benutzern sehr gut angenommen. Dieses Tool lieferte uns die nötige Power um schnell und serienmässige hochwertige Artikel zu erstellen. Das Ausgestalten der Spins, das Korrekturlesen und die Verwendung von Datenfeldern im Text ist sicher mit etwas Übung verbunden.
Google kann mittlerweile sehr gut die Übereinstimmung von Texten erkennen, auch wenn sie allein bezogen auf die verwendeten Wörter voneinander abweichen. Denn bei der Überprüfung auf Duplicate Content hin werden zahlreiche linguistische Faktoren mit einbezogen, insbesondere semantische Faktoren. Gespinnte Texte, bei denen nur die einzelnen Wörter durch Synonyme ersetzt wurden, sind durch Algorithmen von Google mittlerweile sehr gut erkennbar.
You could also highlight or develop a major point more with a sidebar-type box. This is an extra bit of writing that delves more deeply into one aspect of the subject. For example, if you’re writing about your city’s film festival, you might include a sidebar write-up that highlights one of the films. These types of write-ups are usually short (50-75 words, depending on the publication outlet).
See more: spinning copyright suit articles, writing the right way, writing synonym, writing quote, writing prompt, writing it right for you, writing effective sentences, writing effective content, writing a sentence, word spinner software, what is the importance of software, what is syntax in writing, what is good writing, what is effective writing, what is a writing prompt, ways of article writing, way of writing article, way of writing an article, the importance of writing, the best article writing software
In diesem Artikel habe ich demonstriert, wie man mit dem HTML Scraper des Article Wizards in wenigen Minuten die Informationsgrundlage für themenspezifische Landing Pages organisieren kann. Weiterhin wurden diese Informationen mit Hilfe der ebenfalls neuen Variablenfunktion in einen gespinnten Text integriert, aus dem dann wiederum 80 Landing Pages mit Unique Content erzeugt wurden.
Leider handelt es sich bei den vorliegenden URLs um relative URLs, deshalb kann ich sie nicht direkt weiterverwenden sondern muss sie zuerst in absolute URLs umwandeln. Dazu kann Microsoft Excel verwendet werden, indem einfach mit der Funktion „Verketten“ der fehlende Teil der URL („http://de.wikipedia.org“) ergänzt wird. Wie das im Detail funktioniert, demonstriert der folgende Screenshot:
Das Ziel ist es also, alle Stadtnamen von der Tabelle unter http://de.wikipedia.org/wiki/Liste_der_Gro%C3%9Fst%C3%A4dte_in_Deutschland#Aktuelle_Gro.C3.9Fst.C3.A4dte zu extrahieren. Dazu benötigen wir zunächst einmal den entsprechenden XPath-Ausdruck, den wir mit dem Firebug Addon FirePath bekommen, indem wir auf den ersten Stadtnamen mit der rechten Maustaste klicken und im erscheinenden Kontextmenü den Punkt „Inspect in FirePath“ auswählen. Die folgende Abbildung verdeutlicht das:
×