Kategorie

A B C D E
F G H I J
K L M N O
P Q R S T
U V W X Y
Z 0      

suchmaschine

sa sb sc sd se sf sg sh si sj sk sl sm
sn so sp sq sr ss st su sv sw sx sy sz

Suchmaschine

Eine Suchmaschine ist ein Programm zur Recherche von Dokumenten, die in einem Computer oder einem Computernetzwerk wie z.B. dem World Wide Web gespeichert sind. Nach Eingabe einer Suchanfrage - bestehend aus Schlagwörtern und der Art ihrer logischen Verknüpfung - liefert eine S. eine Liste von Verweisen auf relevante Dokumente oder Webseiten, meist dargestellt mit Titel und einem kurzen Auszug des jeweiligen Dokuments.

In der Regel erfolgt die Datenbeschaffung automatisch durch Webcrawler und Indexierung. Wird die Datenakquisition manuell mittels Anmeldung oder durch Lektoren vorgenommen, handelt es sich um einen Katalog bzw. ein Directory. In solchen Verzeichnissen wie beispielsweise Yahoo und dem Open Directory Project sind die Dokumente hierarchisch in einem Inhaltsverzeichnis nach Themen organisiert.

Die zur Suche nötige Datenbasis gewinnen Suchmaschinen meist durch automatisierten Abruf und Indexierung einer großen Anzahl von Webseiten sowie Verfolgung der darin enthaltenen Verweise, d.h. Links, oder im Fall von Metasuchmaschinen (z.B. MetaGer) durch Rückgriff auf mehrere andere Suchmaschinen.

Die Darstellung der Suchergebnisse geschieht sortiert nach Relevanz (Ranking), wofür jede Suchmaschine ihre eigenen, geheimen Kriterien heranzieht. Das können z.B. Häufigkeit und Stellung der Suchbegriffe im jeweiligen gefundenen Dokument, die Einstufung und Anzahl der zitierten Seiten, sowie die Häufigkeit von Verweisen anderer Dokumente auf das im Suchergebnis enthaltene Dokument sein.

Manche Suchmaschinen sortieren Suchergebnisse nicht nur nach Relevanz für die Suchanfrage sondern lassen gegen Bezahlung auch Einflussnahme auf ihre Ausgabe zu.

Eine der ersten Suchmaschinen war Lycos, die 1994 als Universitätsprojekt gestartet ist. Vorher gab es schon andere, z.B. Archie oder Veronica, die aber nicht mit einer graphischen Web-Oberfläche ausgestattet waren.

Herausforderungen für Suchmaschinen:

  • Mehrdeutigkeit: Suchanfragen von Benutzern und Inhalte von Webseiten sind häufig unklar und mehrdeutig. Die Suchmaschine muss natürliche Texte zu einem gewissen Grad "verstehen", um relevante Antworten liefern zu können. Idealerweise wird eine Suchmaschine zur Anfrage "Rechner Linux" auch Seiten liefern, die das Wort "Rechner" gar nicht enthalten und statt dessen "Computer" benutzen.
  • Datenmenge: Das Web wächst schneller als die Suchmaschinen mit der derzeitigen Technik indizieren können.
  • Aktualität: Viele Webseiten werden häufig aktualisiert, was die Suchmaschinen zwingt, diese Seiten immer wieder zu besuchen.
  • Spam: Mittels Suchmaschinen-Spamming, d.h. mit unlauteren Methoden (z.B. versteckten Texten und unsichtbaren Links auf der Webseite, automatischen Weiterleitungen von gut platzierten Brückenseiten auf unerwünschte Seiten), versuchen selbsternannte "Suchmaschinen-Optimierer", den Algorithmus einer Suchmaschine, der für die automatische Bewertung und günstige Platzierung von Webseiten in den Ergebnislisten zuständig ist, auszutricksen. Mit anderen Worten: Die Manipulateure versuchen, ihre eigenen Internetseiten (oder die ihrer Kundschaft), die normalerweise nicht unter den besten Ergebnissen einer Suchabfrage angezeigt würden, durch Anwendung diverser Spamming-Methoden in den Ergebnislisten der Suchmaschinen möglichst weit vorn zu platzieren. Dadurch liefert die Suchmaschine auf ihren ersten Ergebnisseiten keine relevanten, vom Surfer gewünschten Resultate mehr, sondern präsentiert dem Internetnutzer die Seiten des Spammers. Die meisten Suchmaschinen versuchen, sich gegen diese Form der Manipulation zu wehren.

Siehe auch (Themen die noch nicht ausreichend im Artikel behandelt werden): PageRank-Algorithmus, Hubs und Authorities, Webcrawler, Google-Bombe, Linkfarm, Web Impact Faktor, Information-Retrieval, Vektorraum-Retrieval, Data Mining, Stemming, Semantic Web, AltaVista, Google, Open Archives Initiative, Deep Web

Dieser Artikel ist Teil des WikiReader Internet. Dies bedeutet, dass der Artikel regelmäßig überprüft und zusammen mit anderen Artikeln in ein PDF eingearbeitet wird. Es existiert auch eine gedruckte Ausgabe.

Impressum

Datenschutzerklärung