- > Bibliotheken
- > Internetkurs
- > Suchdienste
- > Suchmaschinen
Suchmaschinen
Suchmaschinen (Roboter und Spider)
Im Gegensatz zu den Verzeichnissen arbeiten Suchmaschinen mit voll automatisierten Suchrobotern, die den
semantischen Aspekt nicht berücksichtigen. Roboterbasierte Suchmaschinen gehen im Wesentlichen in drei Schritten vor.
Zunächst durchsucht der Informationssammler, "Robot", "Spider" oder "Crawler" genannt, das Internet automatisch
nach neuen oder veränderten Seiten und legt einen riesigen Datenpool beim Suchmaschinenbetreiber an. Im zweiten Schritt
wird programmgesteuert ein alphabetischer Index aus allen in den gefundenen Seiten vorkommenden Wörtern
erzeugt.
Eine weitere Software wertet die Suchanfragen aus, verknüpft logische Operatoren und schickt die Anfrage an den
Datenserver, um von dort aus die Ergebnisse in einer Trefferliste zu präsentieren. Die Sortierung der Treffer erfolgt
nach einem Relevanzverfahren. Wenn das gesuchte Wort im Titel oder im Meta-Tag der Beschreibung vorkommt, wird es höher
gewichtet als im Body-Text und in der Trefferliste am Anfang angezeigt.

Erste Einträge der Trefferliste von Google zu Unfallversicherung
Vorteile: Man findet Suchwörter auch in Dokumenten, in denen man sie nicht vermutet hätte. So zum Beispiel Personennamen in Literaturlisten oder Adressverzeichnissen. Zudem bieten die Suchmaschinen in der Regel umfangreiche Möglichkeiten der logischen Verknüpfung von Suchbegriffen, die eine gezielte Recherche ermöglichen.
Nachteil: Die Suchmaschine liefert unter Umständen tausende von Dokumenten, die erst auf ihre Relevanz für die FRagestellung geprüft werden müssen. Zum Beispiel wäre es unsinnig, nach einem häufigen Begriff, wie "Wasser" zu suchen. Die Trefferliste von Google zeigt 65 Millionen Seiten! Der bei den Katalogen durch eine Redaktion berücksichtigte sachliche Zusammenhang muss hier vom Benutzer durch Verknüpfung mit weiteren Begriffen wie z.B. Energiegewinnung oder Landwirtschaft hergestellt werden.
Die meisten Suchmaschinen erlauben eine Einengung der Suchkriterien. Einige kommen so zu außerordentlich präzisen Ergebnissen. Andere suchen im wahrsten Sinne des Wortes "global". Ob man nun eine Maschine mit zahlreichen Spezifizierungsmöglichkeiten wählt, oder es über eine globale Suche versucht, um überhaupt Dokumente, z.B. zu einem sehr "exotischen" Thema zu finden, hängt wieder vom Rechercheziel ab.
Ausgewählte Suchmaschinen:
|
Suchmaschinen und Suchdienste, deutsch
|
Suchmaschinen und Suchdienste, englisch
|
Suchmaschinenindex- Verzeichnis von nationalen und internationalen Suchmaschinen
Unterschiede bei den Suchmaschinen:
- Anspruch auf Vollständigkeit oder Spezialisierung auf Dokumente in einer bestimmten Sprache, zu einzelnen Teilgebieten, aus bestimmten Internetdiensten;
- in den Verfahren bei der Suche nach neuen oder geänderten Informationen;
- in der Aktualität der gespeicherten Dokumente (Dauer der Aktualisierungszyklen);
- beim Aufwand für die Analyse der Dokumente für die Relavanz (Ranking);
- im Umfang und der Leistungsfähigkeit der Datenbanken (Antwortzeiten);
- in der Flexibilität der Abfragesprache, in der die Benutzer die Suchanfragen formulieren können;
- in der Unterstützung der Nutzer bei der Auswertung der Suchergebnisse (Relevanzberechnung, weitere Abfragen zur Eingrenzung der Treffer usw.)
Verschiedene Tests haben gezeigt, dass auch die drei großen Suchmaschinen mit eigenem Index Google, Yahoo,
LiveSearch nur etwa maximal 70% der im Internet vorhandenen relevanten Dokumente zu einer Fragestellung ermitteln
können. Es empfiehlt sich daher, bei der Recherche mehrere Suchmaschinen oder Kataloge zu benutzen.
Metasuchdienste
Folgendes finden Suchmaschinen nicht:
- Dokumente auf Servern, auf die noch keine Hyperlinkszeigen;
- Dokumente, die erst nach der letzten Aktualisierung der Datenbank veröffentlicht oder geändert wurden (die Zeiten, die die einzelnen Dienste benötigen, um ihren gesamten Datenbestand einmal zu aktualisieren, sind unterschiedlich);
- durch Passworte oder Firewalls geschützte Dokumente;
- Dokumente in Bereichen, die vom Server-Betreiber für Suchroboter gesperrt wurden oder die eine Registrierung verlangen;
- von CGI-Skripten oder Datenbank-Gateways dynamisch erzeugte Dokumente (d.h. alle in Web-Datenbanken gespeicherten
Informationen - außer wenn diese offline als Webseiten aufbereitet werden - können nicht gefunden werden)
Deep Web

Versenden
Seitenfeedback
Webcode:
d33315