In den vergangenen Wochen habe ich mich ein wenig mit meinem Google Webmasters Panel auseinander gesetzt und den ein oder anderen Fehler ausgemerzt, der dazu führen könnte, dass ich erneut meinen PageRank verliere. Dies war bereits im Juli letzten Jahres geschehen, da ich wohl zuviele nicht erreichbare Seiten hatte. Mittlerweile habe ich wieder meinen damaligen PR3, de ich auch gerne behalten möchte.

Damals war das Plugin Global Translator dafür verantwortlich, welches bei einer nicht vorhandenen Übersetzung ein 404 ausgespuckt hatte, was Google nicht so sehr gefallen hatte. Mittlerweile siehts in meinen Google Webmaster Tools schon wieder nicht so rosig aus. Da der Anteil ausländischer Besucher aus Ländern, deren Sprache nicht Englisch oder Chinesisch ist, täglich nur bei ~2% liegt, habe ich mich nun entschlossen, alle überflüssigen Sprachen zu entfernen, um mehr Anfragen für die Übersetzungen der Sprachen Englisch und Deutsch verfügbar zu haben. Natürlich ist das nicht so leicht, da ja doch mittlerweile knapp 12k Seiten im Google Index gelandet sind und ich für Unerreichbarkeit keine Schelte bekommen möchte ;)

Der mehrstufige Actionplan sieht nun folgendes vor:

  • Erstellung von Rewrite-Rules für nginx zur 301-Umleitung (Moved Permanentely) auf Webserverebene
  • Beantragung der Entfernung der Übersetzungen aus dem Google Suchindex
  • Anpassen der Einstellungen in Global Translator
  • Entfernung der überflüssigen Übersetzungsverzeichnisse
  • Aktualisierung des Page-Cache

Erstellung von Rewrite-Rules für nginx zur 301-Umleitung

Die Übersetzungslinks sollen für eventuelle, schon vorhandene Verlinkungen, auf den Originalartikel umgeleitet werden. Da ich, wie vielleicht einige wissen, als Webserver Nginx einsetze (Siehe Leitartikel), benötige ich hierfür die entsprechenden Rewrite-Rules. Leider bin ich ein Experte in Regex, jedoch funzt der folgende Code:

1
2
3
location ~* ^/(ar|be|ca|cs|da|el|es|et|fa|fi|fr|ga|gl|hu|is|ko|mk|ms|mt|nl|bg|hr|id|it|hi|iw|ja|no|lv|lt|pl|pt|ru|sk|sl|sq|sr|sv|ro|th|tl|tr|uk|vi)/ {
  rewrite ^/(ar|be|ca|cs|da|el|es|et|fa|fi|fr|ga|gl|hu|is|ko|mk|ms|mt|nl|bg|hr|id|it|hi|iw|ja|no|lv|lt|pl|pt|ru|sk|sl|sq|sr|sv|ro|th|tl|tr|uk|vi)/(.*)$ /$2 permanent;
}

Er muss mit in den Server-Teil der betreffenden Blog-Domain eingebaut werden. Vermutlich könnte man von der Location her direkt die Sprache capturen, so wie oben funzt es aber auf jeden Fall ;) Die Sprachen “en”, “zh-CN” und “zh-TW” habe ich weggelassen, da ich diese vorerst weiter behalte.

Beantragung der Entfernung der Übersetzungen aus dem Google Suchindex

Bis dato hatte ich von den angebotenen Sprachen des Global Translator nur jene aktiviert, die seitens Google Adsense erlaubt sind. Diese müssen nun über die Google Webmaster Tools entfernt werden. Dazu loggt man sich zunächst dort  ein. Man wählt die betreffende Webseite und geht zu “Website-Konfiguration” -> “Crawler-Zugriff”. Dort klickt man auf den Tab “URL entfernen”. Im folgenden Auswahlfenster wählt man dann als Option “Ein Verzeichnis sowie alle Unterverzeichnisse auf der Website”, da wir beispielsweise /ar/* entfernen möchten. Im nächsten Eingabefeld muss dann ar/ eingegeben werden.

Webmaster Tools
Webmaster Tools
Webmaster Tools

Laut Google  sollte man ausserdem nun die robots.txt anpassen, da ein 301 Redirect nicht als “nicht mehr erreichbar” gilt. Hierzu legt man für jede entfernte Sprache ein

1
Disallow: /{SPRACHCODE}/

an, sodass dies dann beispielsweise so aussieht:

1
2
3
User-agent: *
Allow: /
Disallow: /ar/

Anpassen der Einstellungen in Global Translator

Nun rate ich dazu, die Sprachen im Plugin zu entfernen. Bei mir bleiben derzeit nur “en”, “zh-CN” und “zh-TW” übrig, den Rest habe ich deaktiviert. Nach dem Speichern sollte die Sitemap neu erzeugt werden, da nun die überflüssigen Sprachen wegfallen.

Entfernung der überflüssigen Übersetzungsverzeichnisse

Hat man die obigen Schritte erfolgreich durchgeführt, so können die überflüssigen Übersetzungsverzeichnisse gelöscht werden. Glücklich ist, wer Shellzugriff hat, da gehts etwas schneller als per FTP ;). Die Übersetzungen finden sich in {WORDPRESS_HOME}/wp-content/gt-cache/. Ich würde das Verzeichnis “stale” nicht mitlöschen, auch dort würde ich nur die nicht mehr benötigten Sprachen entfernen.

Aktualisierung des Page-Cache

Ich setze für das Cachen meiner Seiten das Plugin WP-Super-Cache  ein, welches nun auch aktualisiert werden sollte. Ein Klick auf “Delete Cache” auf der Einstellungsseite des Plugins würde dies durchführen. Ich persönlich verwende aber zusätzlich das Plugin “ Askapache Crazy Cache ”, welches mir erlaubt, schnell alle Seiten neu zu cachen. Auf einem shared Webspace macht dies jedoch nur begrenzt Sinn, da die CPU-zeit häufig begrenzt ist.

Fazit: So bin ich nun relativ sauber die überflüssigen Sprachen losgeworden und hoffe so die nicht erreichten Seiteninhalte reduzieren zu können.