SEO mit KNIME

KNIME Rule Engine für SEO

Der Rule Engine Node von KNIME erleichtert die SEO Arbeit insbesondere wenn es darum geht, Daten wie Query-Strings aus der Google Search Console oder URLs zu klassifizieren. Ebenso können beispielsweise Klick-Daten nach High- und Low-Performern zugeordnet werden, indem nach Schwellwerten klassifiziert wird.

Dazu legt man eine oder mehrere Regeln an, nach denen in einem Feld gesucht und entsprechend ein Wert in eine weitere Spalte eingetragen werden soll.

Für das Beispiel habe ich die XML Sitemap vom t3n.de Magazin per XML Reader importiert und mir die URLs mit dem XPath Node extrahiert.

Die Output Table des XPath Nodes sieht so aus:

Anschließend definiere ich einige Regeln auf Basis der URLs, um diese den Klassen zuzuordnen. Für die einfache Suche nach Mustern in einem String, hilft die LIKE-Funktion mit einer *-Wildcard-Suche. Für komplexere Muster kannst du mit MATCHES auch reguläre Ausdrücke (RegEx) anwenden.

Die Output-Tabelle des Rule Engine Nodes enthält nun eine weitere Spalte mit allen Klassen, die vorher definiert wurden.

Mit TRUE wurde in dem Regel-Set noch eine Ausgabe definiert, für alle URLs, die nicht von den aktuellen Regeln klassifiziert wurden.

Mit dem GroupBy-Node kann nun eine erste Auswertung erfolgen, die die Anzahl der URLs pro Klasse ausgibt.

Hierzu wird über die URL Klasse gruppiert.

Und dann im Reiter „Manual Aggregation“ ein Count über die URLs definiert.

Nun können wir sehen, wie viele URLs pro Klasse existieren.

Möchte man nun die Klasse „Andere“ noch weiter aufschlüsseln, damit noch mehr URLs klassifiziert werden, kann ein einfacher Row-Filter-Node verwendet werden, der in der Spalte „URL Klasse“ nach „Andere“ sucht und die entsprechenden URLS filtert.

Die Tabelle mit den gefilterten URLs sieht dann so aus. Hier kann man recht schnell erkennen, welche URLs noch nicht mit den bisherigen klassifiziert wurden. Die fehlenden Regeln ergänzt man nun einfach im Rule Engine Node bis alle relevanten Datensätze erfasst bzw. klassifiziert wurden.

Die Stärke von KNIME wird auch in diesem Beispiel wieder sichtbar, denn hat man einmal alle relevanten URLs einer Domain klassifiziert, kann man diesen Workflow jeder Zeit wieder auf neue Daten zum Beispiel aus einem Crawl, einer Ranking-Analyse oder auf einen Export aus der Google Search Console anwenden.

Den kompletten Workflow kannst Du dir hier runterladen:

knime-rule-engine-workflow-zum-klassifizieren.knwf

Viel Spaß beim testen und klassifizieren!

über

Seit 2011 beschäftigt sich Raphael mit Suchmaschinenoptimierung. Sein Wissen und seine Erfahrung hat er bereits in Agenturen, kleinen und großen Unternehmen gesammelt und eingebracht.

0 Kommentare zu “KNIME Rule Engine für SEO

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert