Bearbeiten von „Suchstrategien im Internet-The Deep Web

Zur Navigation springen Zur Suche springen
Warnung: Du bist nicht angemeldet. Deine IP-Adresse wird bei Bearbeitungen öffentlich sichtbar. Melde dich an oder erstelle ein Benutzerkonto, damit Bearbeitungen deinem Benutzernamen zugeordnet werden. Ein eigenes Benutzerkonto hat eine ganze Reihe von Vorteilen.

Die Bearbeitung kann rückgängig gemacht werden. Bitte prüfe den Vergleich unten, um sicherzustellen, dass du dies tun möchtest, und veröffentliche dann unten deine Änderungen, um die Bearbeitung rückgängig zu machen.

Aktuelle Version Dein Text
Zeile 36: Zeile 36:
Die zweite Möglichkeit ist die Verwendung des robots.txt Dateiformats. Hierbei wird den Suchmaschinen der Zugang zum Dokument verboten.
Die zweite Möglichkeit ist die Verwendung des robots.txt Dateiformats. Hierbei wird den Suchmaschinen der Zugang zum Dokument verboten.
Die dritte Möglichkeit ähnelt der im vorherigen Abschnitt erwähnten Möglichkeit im Ansatz etwas. Hierbei wird der „no index tag“ verwendet, um auf diese Art und Weise das Lesen des Dokuments durch die Suchmaschine zu unterbinden.
Die dritte Möglichkeit ähnelt der im vorherigen Abschnitt erwähnten Möglichkeit im Ansatz etwas. Hierbei wird der „no index tag“ verwendet, um auf diese Art und Weise das Lesen des Dokuments durch die Suchmaschine zu unterbinden.
 
=== Propriatary Web:===
=== Propriatary Web:===
 
Der Zugang zum „Propriatary Web“ ist nur durch die Zustimmung zu speziellen Bedingungen, wie zum Beispiel einer Registrierung möglich. Die Crawler, also die Suchmaschinen, können sich nicht automatisch bei einer Internetseite registrieren und haben aus diesem Grund keine Zugriffsmöglichkeit auf die Dateien. Weiterhin gibt es die Möglichkeit, Informationen nur nach erfolgreicher Zahlung zu erhalten. Auch dies ist den Suchmaschinen nicht möglich und führt dann zum Verlust dieser Informationen bei der Trefferliste. <ref> vgl. Sherman, Chris und Gary Price 2001, S. 70-74 </ref>
Der Zugang zum „Propriatary Web“ ist nur durch die Zustimmung zu speziellen Bedingungen, wie zum Beispiel einer Registrierung möglich. Die Crawler, also die Suchmaschinen, können sich nicht automatisch bei einer Internetseite registrieren und haben aus diesem Grund keine Zugriffsmöglichkeit auf die Dateien. Weiterhin gibt es die Möglichkeit, Informationen nur nach erfolgreicher Zahlung zu erhalten. Auch dies ist den Suchmaschinen nicht möglich und führt dann zum Verlust dieser Informationen bei der Trefferliste. <ref> vgl. Sherman, Chris und Gary Price 2001, S. 70-74 </ref>
 
===Truly Invisible Web=== Das „Truly Invisible Web“ oder auch das sogenannte  wirklich unsichtbare Web. Aus unterschiedlichen technischen Gründen können Suchmaschinen in diesem Fall das gewünschte Material nicht finden. Dabei handelt es sich meistens um Web- oder Dokumentenformate, die von den Suchmaschinen nicht gelesen werden können. Diese Dateien enthalten meistens nur wenig oder gar keinen Text und fallen damit durch das Raster der Suchmaschinen. Sie werden daraufhin nicht aufgenommen, bei Suchanfragen nicht beachtet und sind daher ein Teil des Deep Webs. Beim „Truly Invisible Web“ ist es wichtig zu beachten, dass die Informationen, die nicht aus einer Datenbank kommen und daher nicht mit einem Schlüssel ausgegeben werden können unsichtbar sind. Die Crawler verstehen diese unbekannte Struktur des Dokuments und der Datenbank nicht und haben daher keinen Zugriff auf die Inhalte des Dokuments. <ref> vgl. Sherman, Chris und Price, Gary 200s1, S. 70-74 </ref>
===Truly Invisible Web===  
 
Das „Truly Invisible Web“ oder auch das sogenannte  wirklich unsichtbare Web. Aus unterschiedlichen technischen Gründen können Suchmaschinen in diesem Fall das gewünschte Material nicht finden. Dabei handelt es sich meistens um Web- oder Dokumentenformate, die von den Suchmaschinen nicht gelesen werden können. Diese Dateien enthalten meistens nur wenig oder gar keinen Text und fallen damit durch das Raster der Suchmaschinen. Sie werden daraufhin nicht aufgenommen, bei Suchanfragen nicht beachtet und sind daher ein Teil des Deep Webs. Beim „Truly Invisible Web“ ist es wichtig zu beachten, dass die Informationen, die nicht aus einer Datenbank kommen und daher nicht mit einem Schlüssel ausgegeben werden können unsichtbar sind. Die Crawler verstehen diese unbekannte Struktur des Dokuments und der Datenbank nicht und haben daher keinen Zugriff auf die Inhalte des Dokuments. <ref> vgl. Sherman, Chris und Price, Gary 200s1, S. 70-74 </ref>


=== Unterscheidung nach Pedly (2001) ===
=== Unterscheidung nach Pedly (2001) ===

Bitte beachte, dass alle Beiträge zu Wiki von anderen Mitwirkenden bearbeitet, geändert oder gelöscht werden können. Reiche hier keine Texte ein, falls du nicht willst, dass diese ohne Einschränkung geändert werden können.

Du bestätigst hiermit auch, dass du diese Texte selbst geschrieben hast oder diese von einer gemeinfreien Quelle kopiert hast (weitere Einzelheiten unter Wiki:Urheberrechte). ÜBERTRAGE OHNE GENEHMIGUNG KEINE URHEBERRECHTLICH GESCHÜTZTEN INHALTE!

Abbrechen Bearbeitungshilfe (wird in einem neuen Fenster geöffnet)

Die folgende Vorlage wird auf dieser Seite verwendet: