Vom Suchen zum Finden

Von Dirk Asendorpf · 12.06.2007
Bislang liefern die Suchmaschinen nur dann brauchbare Ergebnisse, wenn der Nutzer zumindest prinzipiell verstanden hat, wie die Volltextsuche und das automatische Ranking der Treffer funktionieren. Bei den Suchmaschinen der Zukunft soll nicht mehr das Suchen, sondern das Finden im Mittelpunkt stehen. Auf eine Frage soll keine lange Trefferliste, sondern die richtige Antwort erscheinen.
Pizza ist sein Grundnahrungsmittel. Doch was macht der Computerfreak, wenn er in Corte Madera, einem Vorort von San Francisco, gestrandet ist, sein Internet-Handy nicht dabei hat und plötzlich einen Bärenhunger verspürt? Ganz einfach: Er ruft die kostenlose Google-Hotline an, stellt seine Suchanfrage mündlich und lässt sich die Trefferliste der nächstgelegenen Pizzerien von einer Computerstimme vorlesen.

"Pizza: top A results. Number one: Venice Cycle Restaurant, Pizzeria on Tamalpays Road, to select number one press one or say number one…"

Der Software-Ingenieur Chris Wetherell erklärt auf der Website eine weitere Neuigkeit, den Google-Reader:

"Dein E-Mail-Programm speichert alle eingehenden Nachrichten im Eingangsfach, egal woher sie kommen. Google-Reader macht das Gleiche für das ganze Internet. Du musst nicht mehr all Deine Lieblingsseiten besuchen, um herauszufinden, ob es dort etwas Neues gibt. Sobald eine dieser Websites aktualisiert wurde, bekommst Du sie automatisch von uns und kannst sie lesen, wann immer Du willst. Das ist einfach und kostenlos, wir haben wirklich hart daran gearbeitet und hoffen, dass es Dir gefällt."

280 Millionen Suchanfragen am Tag, 10 Milliarden Dollar Jahrsumsatz, drei Milliarden Gewinn, über 50 Prozent Marktanteil, in Deutschland sogar 85 Prozent – keine Frage: Google ist der Platzhirsch der Suchmaschinenbranche.

Das hat auch die Konkurrenz akzeptiert.

"Ich muss anerkennend sagen, dass Google ganz gut im Geschäft ist und auch innovativ ist und wenn sie das auch weiterhin so bleiben, wird es wahrscheinlich schwierig, aber nicht unmöglich, Google zu schlagen."

Thomas Dominikowski ist für die Produktentwicklung bei Lycos Europe zuständig, der Suchmaschine des Bertelsmann-Konzerns. Obwohl Google alle paar Wochen mit einer neuen Suchvariante auf den Markt kommt, sieht er noch Raum für Innovationen.

"Ich glaube, auch die Großen machen immer mal wieder Fehler und können auch nicht alle Felder besetzen und für Lycos ist es so, dass wir die Strategie fahren, den Nutzern auch ’ne andere Sucherfahrung zu bieten. Ein Ansatz dafür ist Lycos IQ: man tippt nicht ein Keywort in einen Suchschlitz, sondern man fragt, tippt seine Frage ein und andere Nutzer antworten."

Kennt jemand eine möglichst vollständige Liste aller Suchmaschinen im Internet? Die Antwort kommt schon sechs Minuten später. Ein User namens Torshavn schickt einen brauchbaren Link. Fast 5000 Suchmaschinen sind dort verzeichnet. Ihre Ergebnisse präsentieren sie in den unterschiedlichsten Formaten: als farblich markierte und nach Wunschkriterien sortierte Liste, mal mit Vorschaufenster, mal mit einer Grafik, auf der bunte Linien für Links zwischen den Fundstellen stehen, mal werden die Treffer auch als Fähnchen auf einer Landkarte oder als Jahreszahlen auf einem Zeitstrahl abgebildet. Doch so unterschiedlich das auch aussieht, dahinter steckt immer der gleiche Ansatz: mit möglichst viel Computerpower durchforsten die Suchmaschinen den Text im Web nach Stichworten.

Eine grundsätzlich andere Strategie verfolgt Theseus, ein Forschungsprojekt, in dem Unternehmen wie Bertelsmann, SAP und Siemens mit Informationswissenschaftlern zusammenarbeiten. Ihr Ziel ist ein sogenanntes semantisches Web. Wolfgang Wahlster vom Deutschen Forschungszentrum für Künstliche Intelligenz:

"Semantik heißt ja Verstehen von Inhalten, das heißt, wir wollen ein neues Web schaffen, wo der Computer selbst den Inhalt des Dokuments erkennt. Heute muss es ja der Mensch machen, das heißt, eine Suchmaschine gibt Ihnen Dokumente, Sie müssen die durchlesen, und dann stellen Sie in 40 Prozent der Fälle fest: Leider, da steht gar nicht drin, was ich wissen wollte. Und jetzt wollen wir das so machen, dass der Rechner selbst in der Lage ist, die Dokumente zumindest grob so weit zu verstehen, dass der ganze Schrott, so sag ich mal, der heute angeboten wird, schon gleich gar nicht mehr kommt."

Die Frage: "Wie hoch ist die Zugspitze?" soll nicht wie bei Google mit 100.000 Links beantwortet werden, sondern nur mit der richtigen Zahl. Doch das ist schon bei einer so simplen Frage komplizierter als erwartet: Die Angaben im Netz schwanken nämlich je nach Quelle zwischen 2962 und 3000 Metern. Ohne Mitwirkung von Fachleuten ist die semantische Suche undenkbar.

"Das semantische Web kriegt vom Menschen Nachhilfe. Und das wird nur Erfolg haben können, wenn wir die Benutzerpartizipation, die sich ja jetzt in der Welt der Wikis, der Blogs, sehr gut ausgebildet hat, heranziehen, dass jeder hilft ein bisschen auch diese Semantik dem Web beizubringen. Der Rechner alleine wird das nicht schaffen."

Ziel der Theseus-Projektgruppe ist es, die menschliche Mithilfe wiederum so weit wie möglich zu automatisieren: Habe ich in meinem Fachgebiet mit einer Suchanfrage gute Treffer erzielt, wird die Liste, der sogenannte Index, dann auch allen anderen Internetnutzern mit einer ähnlichen Frage zur Verfügung gestellt – natürlich unter Einhaltung des Datenschutzes.

"Das wäre eine reine benutzergetriebene Bewegung, die dann sogar einen Index bilden kann, der besser ist als das, was heute die besten Suchmaschinen liefern. Nur ob das Realität wird, da müssen wir einfach mal sehn, ob genügend Leute den Mumm haben – und vielleicht auch den Frust. Ich hab im Moment das Gefühl, dass viele der jüngeren Generation jetzt durchaus auch kritischer gegenüber Google eingestellt sind. Vielleicht gibt es eine ähnliche Bewegung wie es bei Linux das gab, dass man in diese Richtung geht, aber das kann ich als Wissenschaftler wirklich nicht voraussagen."