Qualifizierungsangebot
Studium
Bildungsgänge
Seminare
Tagungen
Kooperationen
Services
Die DGUV Akademie
Bibliotheken
> Bibliotheken
> Internetkurs
> Suchdienste
> Suchmaschinen

 

Suchmaschinen

Suchmaschinen (Roboter und Spider)

Im Gegensatz zu den Verzeichnissen arbeiten Suchmaschinen mit voll automatisierten Suchrobotern, die den semantischen Aspekt nicht berücksichtigen. Roboterbasierte Suchmaschinen gehen im Wesentlichen in drei Schritten vor. Zunächst durchsucht der Informationssammler, "Robot", "Spider" oder "Crawler" genannt, das Internet automatisch nach neuen oder veränderten Seiten und legt einen riesigen Datenpool beim Suchmaschinenbetreiber an. Im zweiten Schritt wird programmgesteuert ein alphabetischer Index aus allen in den gefundenen Seiten vorkommenden Wörtern erzeugt.
Eine weitere Software wertet die Suchanfragen aus, verknüpft logische Operatoren und schickt die Anfrage an den Datenserver, um von dort aus die Ergebnisse in einer Trefferliste zu präsentieren. Die Sortierung der Treffer erfolgt nach einem Relevanzverfahren. Wenn das gesuchte Wort im Titel oder im Meta-Tag der Beschreibung vorkommt, wird es höher gewichtet als im Body-Text und in der Trefferliste am Anfang angezeigt.

Trefferliste Google

Erste Einträge der Trefferliste von Google zu Unfallversicherung

Als Treffer werden alle von der Suchmaschine ermittelten Seiten aufgelistet, die den Suchbegriff im Text enthalten. Diese Volltextsuche erbringt dementsprechend zahlreiche Ergebnisse, die aber oft wenig zielgenau sind. Das hat Vor- und Nachteile:
Vorteile: Man findet Suchwörter auch in Dokumenten, in denen man sie nicht vermutet hätte. So zum Beispiel Personennamen in Literaturlisten oder Adressverzeichnissen. Zudem bieten die Suchmaschinen in der Regel umfangreiche Möglichkeiten der logischen Verknüpfung von Suchbegriffen, die eine gezielte Recherche ermöglichen.
Nachteil: Die Suchmaschine liefert unter Umständen tausende von Dokumenten, die erst auf ihre Relevanz für die FRagestellung geprüft werden müssen. Zum Beispiel wäre es unsinnig, nach einem häufigen Begriff, wie "Wasser" zu suchen. Die Trefferliste von Google zeigt 65 Millionen Seiten! Der bei den Katalogen durch eine Redaktion berücksichtigte sachliche Zusammenhang muss hier vom Benutzer durch Verknüpfung mit weiteren Begriffen wie z.B. Energiegewinnung oder Landwirtschaft hergestellt werden.

Die meisten Suchmaschinen erlauben eine Einengung der Suchkriterien. Einige kommen so zu außerordentlich präzisen Ergebnissen. Andere suchen im wahrsten Sinne des Wortes "global". Ob man nun eine Maschine mit zahlreichen Spezifizierungsmöglichkeiten wählt, oder es über eine globale Suche versucht, um überhaupt Dokumente, z.B. zu einem sehr "exotischen" Thema zu finden, hängt wieder vom Rechercheziel ab.

Ausgewählte Suchmaschinen:

Suchmaschinen und Suchdienste, deutsch

  • google.de
    Schnelle Antwortzeiten und gutes Ranking
  • yahoo.de
    Neben Verzeichnis auch Suchmaschine mit eigenem Index 
  • Bing Beta
    Suchmaschine von Microsoft mit eigenem Index
  • altavista.de
    Nutzt Index von Yahoo, bietet umfangreiche Verknüpfungen
  • lycos.de
    Umfang: ca. 20 Mio. Webseiten, Update wöchentlich

Suchmaschinen und Suchdienste, englisch

  • google.com
    Bekannteste Suchmaschine im Web
  • yahoo.com
    Suchmaschine mit umfangreichem Index
  • Bing Beta
    Suchmaschine von Microsoft
  • AlltheWeb
    Suchmaschine von Fasr Search mit dem Yahoo-Index
  • Excite Search
    Internetportal mit Suchmaschine und Verzeichnis
  • Ask
    In den USA viel genutz, mit eigener Technologie, ursprünglich aus dem universitären Bereich

Suchmaschinenindex- Verzeichnis von nationalen und internationalen Suchmaschinen

Unterschiede bei den Suchmaschinen:

  • Anspruch auf Vollständigkeit oder Spezialisierung auf Dokumente in einer bestimmten Sprache, zu einzelnen Teilgebieten, aus bestimmten Internetdiensten;
  • in den Verfahren bei der Suche nach neuen oder geänderten Informationen;
  • in der Aktualität der gespeicherten Dokumente (Dauer der Aktualisierungszyklen);
  • beim Aufwand für die Analyse der Dokumente für die Relavanz (Ranking);
  • im Umfang und der Leistungsfähigkeit der Datenbanken (Antwortzeiten);
  • in der Flexibilität der Abfragesprache, in der die Benutzer die Suchanfragen formulieren können;
  • in der Unterstützung der Nutzer bei der Auswertung der Suchergebnisse (Relevanzberechnung, weitere Abfragen zur Eingrenzung der Treffer usw.)

Verschiedene Tests haben gezeigt, dass auch die drei großen Suchmaschinen mit eigenem Index Google, Yahoo, LiveSearch nur etwa maximal 70% der im Internet vorhandenen relevanten Dokumente zu einer Fragestellung ermitteln können. Es empfiehlt sich daher, bei der Recherche mehrere Suchmaschinen oder Kataloge zu benutzen.
Metasuchdienste

Folgendes finden Suchmaschinen nicht:

  • Dokumente auf Servern, auf die noch keine Hyperlinkszeigen;
  • Dokumente, die erst nach der letzten Aktualisierung der Datenbank veröffentlicht oder geändert wurden (die Zeiten, die die einzelnen Dienste benötigen, um ihren gesamten Datenbestand einmal zu aktualisieren, sind unterschiedlich);
  • durch Passworte oder Firewalls geschützte Dokumente;
  • Dokumente in Bereichen, die vom Server-Betreiber für Suchroboter gesperrt wurden oder die eine Registrierung verlangen;
  • von CGI-Skripten oder Datenbank-Gateways dynamisch erzeugte Dokumente (d.h. alle in Web-Datenbanken gespeicherten Informationen - außer wenn diese offline als Webseiten aufbereitet werden - können nicht gefunden werden)
    Deep Web
 

so geht's