Kategorie-Archiv: Google

PAC-MAN Easter-Egg in Google Drive?

Da ich ja ein bekennender Nutzer aller möglichen Google Dienste bin, nutze ich selbstverständlich auch Google Drive. Der Cloud-Service bietet meiner Meinung nach viel mehr, als es Mibewerber wie z.B. Dropbox tun. Zum Thema Google Drive und meiner Nutzung als Dokumenten-Management für das papierlose Büro schreibe ich in Kürze mal. Heute ist mir viel mehr etwas aufgefallen, das vermutlich völlig banal und eher etwas nerdig ist.

Bei 80% Speichernutzung verwandelt sich das Torten-Diagram in "Pac-Man"

Bei 80% Speichernutzung verwandelt sich das Torten-Diagram in “Pac-Man”

Ich kontrolliere gelegentlich, wie viel Speicher ich aktuell nutze. Google zeigt den Wert anschaulich in einem Torten-Diagramm. Als ich den Wert von 80% erreicht hatte, drehte sich das Diagramm und sag “ganz zufällig” aus wie “Pac-Man” – Die entsprechende Abbildung in Wikipedia ist schon mehr als nur ähnlich.

Bei mir tritt dieses Phänomen reproduzierbar auf, allerdings habe ich bisher nichts über ein Easter-Egg in Google Drive gelesen … ist das nur bei mir so? Ist da der Nerd mit mir durchgegangen?

OCR Schrifterkennung in Google Drive

Irgendwie wusste ich ja immer schon, dass Google tolle und mächtige Dienste hat, aber das aktuelle Feauture ist mir heute eher zufällig aufgefallen.

Ich nutze Google Drive für mein digitales Dokumentenmanagement. Die ersten 15 GB sind kostenlos und darüber ist dieser Cloud-Service mehr als erschwinglich (200 GB für ca. 10 EUR). Mittlerweile habe ich dort bereits knapp 30.000 Dateien abgelegt. Die Dokumente sind größtenteils als Fotos in Graustufen abgelegt.

Als ich heute versehentlich das Google-Suchfeld mit dem Google-Drive-Suchfeld verwechselt hatte und nach einem Namen eines Regisseurs gesucht hatte, wurde mir eine alte Amazon-Rechnung angezeigt. Dort stand nirgendwo im Dateinamen, sondern lediglich klein (!) im Bild das betreffende Suchwort. Mehr fach getestet und für faszinierend gefunden, wie hervorragend es funktioniert.

google-drive

… und jetzt höre ich schon den Aufschrei, dass Google selbstverständlich bereits meine 30.000 Dateien systematisch untersucht hat. Ich gehe davon aus, dass Google die Daten niemals gegen mich verwenden wird und daher ist es mir ganz recht, wenn ich so meine Dokumente schneller finden kann.

Cloaking ist böse!

Vor allem dann, wenn es unabsichtlich passiert. Google erkennt so genanntes Cloaking nämlich und straft die Webmaster dafür ab. In meinem Fall hat irgendein “Hacker” über eine Lücke in WordPress unendlich viel Pharma-Spam eingeschleust. Das tückische. Wenn man betreffende Webseiten aufruft, ist das erst einmal nicht zu erkennen, da für den Betrachter nur eine 404-Fehlerseite ausgespielt wird. Für den Google-Bot allerdings stehen dort unzählige Verweise auf die Pharmaseiten drin, die massiv als SPAM gelten.

Da ich den Fehler auch nach intensiver Suche im Quelltext nicht lokalisieren konnte, habe ich mich dazu druchgerungen, meinen Blog mal wieder einen größeren Update zu unterzogen. Alle Systemdateien fliegen vom Server und WordPress wird komplett neu aufgesetzt. Inhalte und Bilder sollten davon unberührt bleiben …

Hier übrigens der Wikipedia-Eintrag zu Cloaking:

Cloaking (engl. verhüllen) ist eine Technik zur Suchmaschinenoptimierung, bei der dem Webcrawler der Suchmaschinen unter der gleichen URL eine andere Seite präsentiert wird als dem Besucher. Sie dient zur Verbesserung der Rangordnung in Suchmaschinen und der Indexierung.

Ziel des Cloakings ist es, gleichzeitig eine für Suchmaschinen und Besucher optimierte Seite zu präsentieren. Da Suchmaschinen primär Textinhalte verarbeiten und indexieren, wird ihnen eine textbasierte, strukturell optimierte HTML-Seite ausgeliefert. Menschliche Besucher, die einen Browser benutzen, erhalten dagegen für die gleiche URL eine für sie optimierte Seite. Diese kann beispielsweise multimediale Inhalte wie Flash-Filme oder Videos enthalten, deren Inhalte für Suchmaschinen unsichtbar sind. Der Verfasser kann mit dieser Methode etwa auch seine Optimierungsmethoden vor den Augen der Konkurrenz schützen.

Google Music in Deutschland verfügbar

Heute ist “Google Music” (eigentlich: “Google Play Music”) in Deutschland gestartet. Dort kann man kostenlos 20.000 Songs in der Cloud speichern (Apple: 25.000 für ca. 25€/Jahr). Ähnlich wie bei Apple muss man nur “unbekannte” Songs hochladen. Der Rest wird mit identifiziert und zur Verfügung gestellt. Importiert werden die Songs mit einem kleinen Tool direkt z.B. aus der iTunes Bibliothek. Leider konnte ich noch nicht rausfinden, ob es einen kostenpflichtigen Weg gibt, mehr als 20.000 Songs zu veröffentlichen …

http://music.google.com/

Google Backlinks entfernen

Die böse Nachbarschaft im Netz.

Sicherlich ist es bekannt, dass Google die Beziehungen von Webseiten untereinander als Kriterium für Relevanz und Gewichtung heranzieht. Generell ist eine Hohe Anzahl von rückverweisenden Backlinks vorteilhaft. Allerdings nur, wenn diese auch aus seriösen Quellen kommen. Damit will Google verhindern, dass man mittels Link-Farmen Seiten (zumeist SPAM-Seiten) populär werden lässt.

Jetzt kann es aber auch vorkommen, dass einen ehrlichen Blogger wie ich es einer bin das Schicksal heimsucht und man ohne eigenes Zutun in diese Böse Nachbarschaft gerät. Aufgefallen ist mir das, als ich kürzlich in den Webmaster-Tools von Google die Anzahl der auf diesen Block verweisenden Backlinks bei 383.183 stehen sah. Das konnte nicht sein und daher hatte ich mir das ganze einmal aufschlüsseln lassen.

In den Keywords “Viagra & Co.” – Na herzlichen Glückwunsch! Selbstverständlich gibt es derartige Inhalte bei mir nicht und so ist auch die Auswertung der 404-Fehler durch Google entsprechend hoch (die selbst führt nicht zu einer Abwertung, aber die Ursache eben schon)

Crawling-Fehler sind unschön, aber Backlinks aus böser Nachbarschaft sind deutlich dramatischer.

Glücklicherweise hat Google ein entsprechendes Tool zur Verfügung gestellt: Disavow Links. Damit kann man verweisende Seiten entsprechend entfernen lassen. Bei einer derart großen Anzahl, wie bei mir wäre das sehr aufwendig, weshalb ich auch komplette Domains sperren lassen kann, wenn ich das in meiner entsprechenden Blacklist vermerke.

Google wertet diese Datei aus und schmeißt die entsprechenden Beziehungen dann auch aus dem Index. Das soll bis zu mehreren Wochen dauern, weil dieser Vorgang auf allen Ebenen bei Google geschieht. Aus diesem Grund sollte man mit der Liste auch sehr vorsichtig sein. Google gibt noch den Hinweis, dass das kein Tool für jedermann sei, sondern sich gezielt an versierte Nutzer richtet.

Hier ein entsprechendes Videos zu dem Thema: