Bearbeiten von „Suchstrategien im Internet-The Deep Web“
Zur Navigation springen
Zur Suche springen
Die Bearbeitung kann rückgängig gemacht werden. Bitte prüfe den Vergleich unten, um sicherzustellen, dass du dies tun möchtest, und veröffentliche dann unten deine Änderungen, um die Bearbeitung rückgängig zu machen.
Aktuelle Version | Dein Text | ||
Zeile 36: | Zeile 36: | ||
Die zweite Möglichkeit ist die Verwendung des robots.txt Dateiformats. Hierbei wird den Suchmaschinen der Zugang zum Dokument verboten. | Die zweite Möglichkeit ist die Verwendung des robots.txt Dateiformats. Hierbei wird den Suchmaschinen der Zugang zum Dokument verboten. | ||
Die dritte Möglichkeit ähnelt der im vorherigen Abschnitt erwähnten Möglichkeit im Ansatz etwas. Hierbei wird der „no index tag“ verwendet, um auf diese Art und Weise das Lesen des Dokuments durch die Suchmaschine zu unterbinden. | Die dritte Möglichkeit ähnelt der im vorherigen Abschnitt erwähnten Möglichkeit im Ansatz etwas. Hierbei wird der „no index tag“ verwendet, um auf diese Art und Weise das Lesen des Dokuments durch die Suchmaschine zu unterbinden. | ||
• === Propriatary Web:=== | |||
=== Propriatary Web:=== | |||
Der Zugang zum „Propriatary Web“ ist nur durch die Zustimmung zu speziellen Bedingungen, wie zum Beispiel einer Registrierung möglich. Die Crawler, also die Suchmaschinen, können sich nicht automatisch bei einer Internetseite registrieren und haben aus diesem Grund keine Zugriffsmöglichkeit auf die Dateien. Weiterhin gibt es die Möglichkeit, Informationen nur nach erfolgreicher Zahlung zu erhalten. Auch dies ist den Suchmaschinen nicht möglich und führt dann zum Verlust dieser Informationen bei der Trefferliste. <ref> vgl. Sherman, Chris und Gary Price 2001, S. 70-74 </ref> | Der Zugang zum „Propriatary Web“ ist nur durch die Zustimmung zu speziellen Bedingungen, wie zum Beispiel einer Registrierung möglich. Die Crawler, also die Suchmaschinen, können sich nicht automatisch bei einer Internetseite registrieren und haben aus diesem Grund keine Zugriffsmöglichkeit auf die Dateien. Weiterhin gibt es die Möglichkeit, Informationen nur nach erfolgreicher Zahlung zu erhalten. Auch dies ist den Suchmaschinen nicht möglich und führt dann zum Verlust dieser Informationen bei der Trefferliste. <ref> vgl. Sherman, Chris und Gary Price 2001, S. 70-74 </ref> | ||
===Truly Invisible Web=== Das „Truly Invisible Web“ oder auch das sogenannte wirklich unsichtbare Web. Aus unterschiedlichen technischen Gründen können Suchmaschinen in diesem Fall das gewünschte Material nicht finden. Dabei handelt es sich meistens um Web- oder Dokumentenformate, die von den Suchmaschinen nicht gelesen werden können. Diese Dateien enthalten meistens nur wenig oder gar keinen Text und fallen damit durch das Raster der Suchmaschinen. Sie werden daraufhin nicht aufgenommen, bei Suchanfragen nicht beachtet und sind daher ein Teil des Deep Webs. Beim „Truly Invisible Web“ ist es wichtig zu beachten, dass die Informationen, die nicht aus einer Datenbank kommen und daher nicht mit einem Schlüssel ausgegeben werden können unsichtbar sind. Die Crawler verstehen diese unbekannte Struktur des Dokuments und der Datenbank nicht und haben daher keinen Zugriff auf die Inhalte des Dokuments. <ref> vgl. Sherman, Chris und Price, Gary 200s1, S. 70-74 </ref> | |||
===Truly Invisible Web=== | |||
Das „Truly Invisible Web“ oder auch das sogenannte wirklich unsichtbare Web. Aus unterschiedlichen technischen Gründen können Suchmaschinen in diesem Fall das gewünschte Material nicht finden. Dabei handelt es sich meistens um Web- oder Dokumentenformate, die von den Suchmaschinen nicht gelesen werden können. Diese Dateien enthalten meistens nur wenig oder gar keinen Text und fallen damit durch das Raster der Suchmaschinen. Sie werden daraufhin nicht aufgenommen, bei Suchanfragen nicht beachtet und sind daher ein Teil des Deep Webs. Beim „Truly Invisible Web“ ist es wichtig zu beachten, dass die Informationen, die nicht aus einer Datenbank kommen und daher nicht mit einem Schlüssel ausgegeben werden können unsichtbar sind. Die Crawler verstehen diese unbekannte Struktur des Dokuments und der Datenbank nicht und haben daher keinen Zugriff auf die Inhalte des Dokuments. <ref> vgl. Sherman, Chris und Price, Gary 200s1, S. 70-74 </ref> | |||
=== Unterscheidung nach Pedly (2001) === | === Unterscheidung nach Pedly (2001) === |