Nach dem einige Leser doch ein recht großes Interesse an dem Artikel über die Möglichkeiten von “Semantischen Suchmaschinen” und das dahingehende Optimierungspotential für SEOS hatten, habe ich mir gedacht, einen ausführlichen Beitrag über die “Semantische Suche im Allgemeinen” zu verfassen. Dabei rausgekommen ist nun folgendes:

Google noch immer Nummer 1

Suchmaschinen - Bild bei dANCE-pHOTOS.deSeit Jahren schon diskutieren zahlreiche Menschen über die “Semantische Suche”. Jede Technologie, die die Chance besitzt den Suchmaschinengiganten Google zu entthronen stößt auf ein reges und breites Interess der “internetalen” Öffentlichkeit, besonders diejenigen, die sich dem Vorteil der langersehnten und “hype-auslösenden” semantischen Technologie bedienen. Aber unabhängig davon, wieviel Fortschritt auch hinsichtlich dieser Suchtechnik gemacht wurde, so blieben doch sämtliche Resultate noch immer hinter unseren Erwartungen zurück. Im Kopf-an-Kopf Vergleich mit Google liefern die sog. semantischen Suchmaschinen nicht wirkliche Neuerungen bzw. weisen keine größeren Unterschiede auf. Warum ist dies so und was läuft falsch?

Ein kleines Beispiel hierfür: Wenn man mit dem Satz “Was ist die Hauptstadt von Frankreich” eine Suchanfrage startet so erhält man sowohl von Google als auch von semantischen Suchmaschinen die gleiche Antwort “Paris” als Ergebnis. Ebenfalls werden zahlreiche Suchanfragen, die wir in Form von Abkürzungen oder Akronymen in Google eingeben genau die gleichen Ergebnisse liefern, als hätten wir die Suchanfrage in unserer “natürlichen” Sprachform gestellt. Klar stimmt da etwas nicht. Wir alle wissen, dass die semantische Technologie äußerst mächtig sein kann, aber wie und warum? In diesem Artikel möchte ich euch zeigen dass nicht unbedingt die Technik das Problem ist, sondern vielmehr wir einfach die falschen Fragen stellen.

Der eigentliche Fehler, den man der Technik zuschreiben könnte ist die Tatsache, dass auch die semantischen Suchmaschinen uns “google-ähnliche” Eingabemasken liefern, die man gewohnheitsmäßig mit abgekürzten Suchwörtern füttert. So tippen wir in die semantischen Suchmaschinen die gleichen “primitiven” Begriffe. Es käme uns doch nie in den Sinn eine Suchanfrage wie folgt zu verfassen,oder?

“Welcher Schauspieler brillierte in beiden Filmen Pulp Fiction und Saturday Night Fever”

Wir tippen lieber einfache Fragen bzw. Akronyme ein, aber darin liegt natürlich nicht die Stärke der semantischen Suchmaschinen. Sehen wir uns doch einmal das semantische Spektrum der Suchmaschinen Google, Yahoo Searchmonkey, Powerset und Freebase an um zu verstehen wie diese Technologie funktioniert.

Welches Problem wollen wir eigentlich lösen?

Die erste Verwirrung, die im Raum steht, ist die Tatsache, dass die semantische Suchmaschinentechnologie die Antwort auf all unsere möglichen Probleme hinsichtlich der modernen Suche (momentan von Google dominiert) und der Problematik rechenintensiver Suchalgorithmen darstellen soll. Die Situation wird jedoch noch etwas haariger, wenn man sich der Sache bewusst wird, dass es nur ein sehr schmales Spektrum gibt, in welchem diese semantischen Suchmaschinen wirklich die besseren Searchengines sind.
Diese Spektrum beinhaltet unter anderem das Involvieren komplexer Suchanfragen und dem darausfolgender Rückbeziehen auf diese anhand eines komplexen Datenbanksets.

Das Spektrum der Probleme innerhalb der semantischen Suche

Spektrum der Probleme innerhalb der semantischen Suche

Wie das obige Diagramm zeigt, werden die rudimentären Basissuchanfragen ohne größere Mühen von Google gehandhabt. Unglücklicherweise birgt die Verarbeitung von natürlicher Sprache nur geringe Vorteile, wenn es zu dieser Kategorie von Problemen kommt. Google antwortet bezüglich der Frage nach Michael Ballacks Geburtsdatum völlig korrekt und lässt keinerlei Möglichkeiten offen die Suche durch das Verstehen von Verben und Nomen, die der Benutzer verwendete, zu verbessern.

Bevor wir uns nun im weiteren mit den Problemkategorien befassen, die hervorragend in das Feld der semantischen Suchmaschinen passen, betrachten wir zunächst einmal das schwierigsten Problemen. Diese Probleme sind rein computer-rechnerischer Natur und haben bei weitem nicht mit Semantik oder dergleichen zu tun. Diese Fehlkonstruktion wurde bereits von Anfang an in dem semantischen System der Suchmaschinenentwicklung verankert, weil wir immer irgendwie die Auffassung vertraten, dass wir in der Zukunft in der Lage sein werden super komplexe Probleme mit purer Rechenleistung im Netz zu lösen.

Dies ist jedoch ein Trugschluss, dem wir schon viel zu lange aufsitzen. Es gibt durchaus fundamentale Grenzen, was wir mit unsren Rechner zu leisten vermögen und eine Kategorie von Problemen die eine exorbitante Anzahl von Lösungen beinhalten wird nicht eines Tages, wie von Zauberhand gelöst werden, nur weil wir die Daten als RDF präsentieren.

Die gute Nachricht ist jedoch, dass es durchaus Probleme gibt die mithilfe der semantischen Suche gelöst werden können. Das sind die Problematiken, die wir bis dato so wunderschön mit in Bezug stehenden Datenbanken, welche über das ganze Internet mit einander vernetzt sind, zu lösen gedenken. Viel zu oft vergessen wir, das die semantische Technologien dazu da sind uns objektive Daten zu präsentieren, die über das ganze Netz verteilt sind. So sollte es keine Überraschung sein, das es in relation stehende Suchanfragen sind mit denen eine semantische Suchmaschine umgehen und rechnen kann.

Das Spektrum der semantischen Suchmaschinenanbieter

Aber die semantische Suche betrifft nicht nur die Frage, die wir an eine Suchmaschine stellen. Da das World Wide Web ein Bündel voller unstrukturierter HTML-Seiten ist, muss die semantische Suchtechnologie auch die darunterliegenden Daten auffinden können. Innerhalb des strukturiertesten Extrems finden wir die Suchmaschine Freebase – die semantische Datenbank für alles und jeden. Freebase kann man über eine normale textbasierte Suche ansteuern, aber viel wichtiger ist die Tatsache, dass dies auch per MQL (Metaweb Query Language) möglich ist. MQL ist im eigentlichen Sinne das gleiche wie JSON inklusive “Wildcards” Benutzt man es, also MQL, so erhält man die Möglichkeit sämtliche Fragen gegenüber Freebase zu konziperen, die dann wiederum mit den selben “Querries” (Fragen) plus Antworten ausgegeben werden.

Semantische Suchmaschinen

Freebase dagegen ist in irgend einer Art, eine in Relation zu einander gebrachte Datenbank. Sie operiert entgegen den marktüblichen Mechanismen gegen eine rein strukturalistische Informationsbeschaffung. Am anderen Ende des Spektrums rangiert Google, welches vorwiegend auf einer statistischen Auswertung der zu Grunde liegenden Daten aufbaut und nur schemenhaft eine semantische Technologie beinhaltet. Die erst vor kurzem veröffentlichte Searchengine von Yahoo, namens Searchmonkey, ist ein interessanter “Zwitter” im Bereich der Suchmaschinen. Sie fügt zwar nichts den Suchergebnissen hinzu, aber anstatt dessen, verwendet sie semantische Anmerkungen um ein reichhaltigeres, interaktiveres und benutzerfreundlicheres Interface zur Verfügung zu stellen.

Firmen wie Hakia und Powerset bearbeiten vermutlich das schwierigste Problem im Bereich der semantischen Suchanfragen und Suchmaschinen. Diese Unternehmen versuchen simultan und “on the fly” Freebase-ähnliche Strukturen aufzubauen, die sie dann obendrein durch Formen der natürlichen Sprache ergänzen. Der Unterschied zwischen Hakia und Powerset liegt darin, dass Hakia eine Technologie verwendet, welche das komplette Internet durchforstet, wohingegen Powerset die semantische Suche auf Wikipedia-Artikel begrenzt.

Sind Hakia, Powerset and Freebase wirklich alle unterschiedlich?

Die Analyse beinhaltet im Folgeschluss eigentlich die Frage, ob die genannten Suchmaschinentechnologien wirklich unterschiedlich sind oder aber im Wesentlichen die selben Mechanismen nutzen. Beschäftigen wir uns doch zunächst mit denjenigen Suchmaschinen, welche man leichter charakterisieren und einordnen kann. Yahoo!’s SearchMonkey binhaltet, zumindest was die reine Suchtechnologie anbelangt, keinerlei Unterschiede im Vergleich zu Google oder irgendeiner anderen Suchmaschine. Der Unterschied liegt in einer abgänderten Darstellung und Präsentation der Suchergebnisse. Searchmonkey kreiert auf intelligente und smarte Art eine neue Benutzererfahrung, indem es den Webseitenbetreibern und Publishern ermöglicht die einzelnen Suchergebnisse, die ihre Webprojekte betreffen, individuell auszugestalten.

Betrachtet man sich nun aber in vergleichender Weise die “Maschinen” von Hakia, Freebase und Powerset, so wird eine Charakterisierung derselbigen schon etwas defizieler. Öberflächlich betrachtet unterscheiden sich alle drei genannten Suchmaschinen voneinander – Hakia lässt einen das komplette Netz durchforsten, Powerset durchsucht lediglich Wikipediaartikel (und Freebase!) und Freebase an sich besitzt zwei unterschiedliche Suchschnittstellen – die “Suchbox” und “die natürlichen Sprachanfragen”.
Hier liegt nun auch das Problem – die Schnittstelle bezüglich der natürlichen Sprache hat in keinster Weise etwas mit der darunterliegenden Datenaufbereitung zu tun.

Fest steht jedoch, dass jede der zuvor vorgestellten Suchmaschinen und “Technologien” es dem Beneutzer erlaubt, arbiträre und komplexe Suchanfragen an die jeweilige Searchengine zu stellen, welche diese dann interpretiert und mit ihrer vorhandenen Datenbank abgleicht. Rudimentär besitzen alle in irgendeiner Weise einen Verarbeitungsmechnismus der is schafft die in natürliche Sprache verfassten Anfragen in “Queries” (Suchanfragen) zu übersetzen die mit Hilfe von Datenbanken abgeglichen werden können.

Um einen kleinen Einblick in diese komplexe Problemstellung und Thematikzu bekommen halten wir uns noch einmal die Suchmaschine Freebase und ihre “Anfragen-Sprache” MQL vor Augen. Entgegen der natürlichen Sprache, welche jegliche Art von Anfragekonstruktionen ermöglicht, ist MQL keineswegs mehrdeutig bzw. ambivalent.

Die JSON-ähnliche “Programmiersprache”, bezeichnen wir sie hier einmal als Suchmaschinensprache, erlaubt es den Benutzern präzise Aussagen gegenüber Freebase zu konzipieren. Die Tatsache, dass Freebase die Eingabe von natürlicher Sprache unterstützt heißt nicht zwingend, dass Freebase keine Datenbanken nutzt. Natürlich ist da eine Datenbank im Hintergrund, die ähnlich der “normalen” Suchanfrage von Freebase im Hintergrund ihre Arbeit verrichtet.
Der wirkliche Unterschied zwischen Freebase und Powerset liegt zum einen in der Datenbeschaffung (und Ansammlung), sowie in der differenten Benutzererfahrung.

Zurück in die Zukunft. Es dreht sich alles um das UserInterface (UI)

Die augenscheinlich auffälligste Neuerung bzw. Enthüllung im Bereich der semantischen Suchmaschinen liegt wohl im Bereich der Userinterfaces, also innerhalb der Benutzeroberfläche. Als erstes sei in diesem Zusammenhang Powerset genannt, die es richtig erkannt hat, dass eine semantische Suche im Bereich der Benutzeroberfläche stattfinden sollte. Nachdem der Benutzer mit Hilfe von Powerset eine Suchanfrage gestartet hat, gelangt er zu einem kontextabhängigen Gadget, welches betreffend der semantischen Resultate, ihm dabei hilft die neuartige Sucherfahrung zu kompletieren.

Aber auch das meiner Ansicht nach größte Problem betreffend der Suchmaschine Powerset ist in deren UI (Benutzerinterface) zu finden. Das Suchfeld, mit dem jedermann durch die traditioniellen Suchmaschinen vertraut ist sollte “abgeschafft” werden. Mit der Involvierung eines solch simplen Suchinterfaces schaden sich Powerset und Hakia, und im geringen Maße auch Freebase, denn dadurch präsentieren sie sich nicht als “generetic Searchenginge”, als als generative, semantische Suchmaschine.

Bedenkt bezüglich dieser These den Start der Suchmaschine Powerset. Das Unternehmen veröffentlichte eine immens verbesserte Methode bzw. Technologie, mit welcher man sich den wichtigsten Informationen des Netzes bedienen, ja sogar in einer gewissen Art mit diesen interagieren, kann – mit den Wikipediaartikeln.

Aber was ließen postwendend die Kritiker bezüglich Powerset verlautbaren? Lasst uns einmal sehen, ob es wirklich ein Google-Killer ist. Und die Antwort darauf war und ist: Nein!
Aber was wäre wenn Powerset die Suchmöglichkeiten begrenzen würde? Was wäre wenn anstatt dem traditionellen Suchfeld eine andere Schnittstelle vorhanden wäre oder man den Benutzern klar vor Augen halten würde dass man nach einfachen Begriffen am besten weiterhin mit Google suchen solle und nicht eben mit Powerset. Warum müssen denn die Unternehmen zwingend einen Algorithmus “angreifen und verbessern”, der seit über einer Dekade das Internet dominiert? Anstatt sich diesen Problemen anzunehmen, sollten sich die Unternehmen lieber mit den Problematiken befassen, die Google bis dato noch nicht lösen kann.

Fazit

Die semantische Suche ist eine Technologie in welche wir einfach zu hohe Erwartungen gesteckt haben. Wir alle haben gehofft und vermutlich auch erwartet dass diese neuartige Suchtechnologie den Marktführer Google vom Thron stoßen würde, in dem sie noch bessere Suchergebnisse liefert. Keine dieser Erwartungen ist jedoch wahr bzw. kann von der neuen Technologie jemals erfüllt werden.
Was jedoch stimmt, ist die Tatsache, dass die semantische Suche sich stetig weiterentwicklen und größer werden wird und uns in Zukunft hilft Fragen zu beantworten, auf die wir bis dato mit der herkömmlichen Technologie noch keine Antworten liefern können.

Damit die semantischen Suchmaschinen innerhalb des hartumkämpften Suchmaschinenmarktes fußfassen können müssen sie gründlich ihre Philosophie und Strategie (das Image einer semantischen Suchmaschine) überdenken und vor allem bessere Benutzeroberflächen zur Verfügung stellen. Ein einfaches Suchfeld erfüllt bei derartigen Suchanfragen einfach nicht mehr die Anforderungen und ist daher meines Erachtens eher kontraproduktiv. Sie benötigen also innovative und vor allem intuitive UIs (Benutzeroberflächen), die dem Benutzer die Stärken einer semantischen Suchmaschine verdeutlichen.

Was haltet ihr denn vonn den neuen Suchmaschinen und was könnte man denn außer den angesprochenen Elementen denn noch verbessern?

Euch hat der Beitrag gefallen? Dann abonniert doch einfach meine Feeds und verpasst nie wieder einen interessanten Artikel.

Quellen: Freebase , Yahoo! Searchmonkey, Google, Wikipedia, Hakia, Powerset

Bildmaterial: ©dance-photos.de / pixelio.de

Teilen Google Buzz vote-share

Ähnliche Beiträge: