Forum
Tipps
News
Menu-Icon

Dokument endgültig löschen

Hallo,

ich bräuchte Hilfe bei folgendem Problem: Ein Word.doc, dass auf einer Website zum Download zur Verfügung stand, wurde via CMS soweit ich mich erinnere gelöscht, allerdings ist das Dokument weiterhin google-bar und somit auch einsehbar. Kann der Grund dafür sein, dass das Dokument noch am Server des Providers liegt. Auf der Website selber kann man es schon lange nicht mehr anklicken und ansehen.


Antworten zu Dokument endgültig löschen:

Hat dir diese Antwort geholfen?

Danke ButtonHilfreiche Antwort Button

 

Zitat
allerdings ist das Dokument weiterhin google-bar und somit auch einsehbar.
Dank Googles Cache-Funktion wird das auch so bleiben bis Google die Website das nächste Mal incl. (INKLUSIVE) des Dokuments spidert resp. entdeckt, dass das Dokument nicht mehr vorhanden ist. Das kann allerdings dauern. Man kann das ganze, so man ein Google Konto  hat und die Google Webmastertools nutzt beschleunigen, selbst dann kann die Aktualisierung einige Zeit (im schlimmsten Fall einige Wochen) dauern. Am probatesten (schnellsten) ist, das Dokument durch ein Dokument mit gleichem Dateinamen aber ohne Inhalt zu ersetzen. 
« Letzte Änderung: 26.01.11, 19:31:50 von PWT »

Hat dir diese Antwort geholfen?

Danke ButtonHilfreiche Antwort Button

Dabei sollte man nicht vergessen, dass das Internet nicht vergisst. So hat jeder, der sich die Datei heruntergeladen hat, diese immer noch. Auch ist die Datei möglicherweise in einem Archiv wie www.archive.org gespeichert. (Das gilt auch, wenn Du eine leere Datei mit gleichem Namen hochlädst.)

Was immer also in dem Dokument stand, Du solltest damit rechnen, dass es Leute gibt die davon Kenntnis haben.

Hat dir diese Antwort geholfen?

Danke ButtonHilfreiche Antwort Button

vielen dank für eure antworten. aber kann es wirklich sein, dass die spider von google die website schon seit 3,5 jahren nicht mehr erfasst haben? es handelt sich dabei auch um keine private website, sondern um eine firmenwebsite, die doch einiges an traffic hat.

nein, leider habe ich kein google-konto. meine vermutung, dass das dokument noch auf dem server des providers liegt und deshalb noch aufscheint, meint ihr ist falsch?

ich glaub mich sogar daran erinnern zu können, dass sich zwei word.doc auf ein- und derselben site befunden haben, dass eine ist nicht mehr einsehbar, das andere schon noch. 

Hat dir diese Antwort geholfen?

Danke ButtonHilfreiche Antwort Button

Wenn Du die URL aufrufst, unter der die Datei zu erreichen war, und Du die Datei nicht bekommst, sondern eine 404 Fehlermeldung (das 404 sollte dabei wichtig sein, steht auf manchen Fehlerseiten aber nur im Dateiheader.), dann ist die Datei gelöscht.

Wenn Du allerdings schon schreibst, dass die Datei im CMS gelöscht wurde, dann kann es durchaus sein, dass sie noch existiert. Ggf müsstest Du mal mit einem FTP-Programm auf den Server schauen ob die Datei noch existiert. Manche CMS löschen lediglich den Link zu der Datei. Bei anderen CMS hast Du die Möglichkeit, die Datei direkt zu löschen.
 

Hat dir diese Antwort geholfen?

Danke ButtonHilfreiche Antwort Button

ich habe jetzt tatsächlich die url aufgerufen - wie war in den google-suchergebnissen angeführt - und es kommt besagt 404 fehlermeldung. also dürfte das dokument gelöscht sein.

was kann ich jetzt noch tun, damit das dokument in den sucherebnissen nicht mehr auffindbar ist?

Hat dir diese Antwort geholfen?

Danke ButtonHilfreiche Antwort Button

Also spontan fällt mir dazu nur ein, in der robots.txt den Zugriff auf die Datei zu verbieten.

Hier eine Doku zur robots.txt

Ich habs noch nicht ausprobiert aber ich könnte mir vorstellen, dass Suchmaschinen die Datei aus dem Index nehmen, sofern sie sie in der robots.txt als disallowed finden. Kann allerdings was dauern.

Hat dir diese Antwort geholfen?

Danke ButtonHilfreiche Antwort Button

ok, vielen dank für den tipp. leider kenn ich mich bei solchen sachen aber überhaupt nicht aus. ich habe den content immer nur über das cms gewartet. 

Hat dir diese Antwort geholfen?

Danke ButtonHilfreiche Antwort Button

Hi,

ich arbeite grundsätzlich nie mit CMS (unter anderem, weil dies zur Folge hat, dass man sich auch nach jahrelanger Erfahrung immer noch nicht mit den wichtigsten Dingen auskennt.) und weiss deshalb nicht, ob Dein CMS die Möglichkeit beinhaltet, eine robots.txt zu erstellen.
In deinem Fall sollte sie jedenfalls folgenden Inhalt haben:

User-agent: *
Disallow: /Word.doc
Disallow: /Ordner/Word.doc

Die erste Disallow-Zeile nutzt Du, wenn sich das Word-Dokument im Basisverzeichnis der Domain befindet. Die Zeile darunter, wenn sie sich in einem Unterordner befindet. "Word.doc" ist dabei durch den Namen der Datei und "Ordner/" durch den Pfad der Datei zu ersetzen. In dem Beispiel oben durchsuchen die Suchmaschinen also die folgenden Dateien nicht:

www.example.com/Word.doc
www.example.com/Ordner/Word.doc

die Robots.txt muss sich auf jeden Fall im Basisverzeichnis befinden, also unter
www.example.com/robots.txt erreichbar sein. Außerdem gilt natürlich zu bedenken, dass es im Ermessen des Suchmaschinenbetreibers liegt, sich an die robots.txt zu halten oder nicht.

Hat dir diese Antwort geholfen?

Danke ButtonHilfreiche Antwort Button

vielen dank für deine antwort. tja, da hast du sehr wohl recht, cms ist ein sehr simples tool und nichts für einen richtigen webmaster, der ich auch nicht bin. in meinem fall bin ich schon einmal sehr froh, dass ich mich überhaupt mit dem cms auskenne :D

nun zu einer anderen frage: ich checke einmal im monat die statistik zur website, die uns unser provider zur verfügung stellt, um zu sehen, ob und wie viele user unsere website interessiert. wie sehr kann ich mich auf die kategorie "unterschiedliche besucher" verlassen? denn so mancher user, davon gehe ich aus, hat keine fixe ip-adresse. was ist eure meinung dazu?

Hat dir diese Antwort geholfen?

Danke ButtonHilfreiche Antwort Button

nun zu einer anderen frage: ich checke einmal im monat die statistik zur website, die uns unser provider zur verfügung stellt, um zu sehen, ob und wie viele user unsere website interessiert. wie sehr kann ich mich auf die kategorie "unterschiedliche besucher" verlassen? denn so mancher user, davon gehe ich aus, hat keine fixe ip-adresse. was ist eure meinung dazu?

Diese Statistiken sind eigentlich eine der verlässlichsten Informationen, die man bekommen kann. Allerdings zählt "unterschiedliche Besucher" tatsächlich die IP-Adressen. Somit kannst Du davon ausgehen, dass jemand, der an einem Tag Deine Webseite besucht hat und dies am nächsten Tag wieder macht, doppelt gezählt wird. Das ist aber nicht weiter schlimm, denn das ist immernoch sehr Aussagekräftig. Immerhin bedeutet das, dass sich jemand für Deine Seite interessiert. Sonst hätte er sie kein zweites Mal besucht.

Eher für den Allerwertesten sind hingegen solche Besucherzähler oder Tools wie Google Analytics. Das fängt schon damit an, dass die nur User zählen, die Javascript installiert haben.

« Webdesign Lehrgang... CSS: Div-Hintergrundfarbe »
 

Schnelle Hilfe: Hier nach ähnlichen Fragen und passenden Tipps suchen!

Fremdwörter? Erklärungen im Lexikon!
Download
Unter Download versteht man den Transport aller Dateien aus dem Internet auf Ihren Rechner. Mit "downloaden" wird also das Herunterladen von Dateien aus dem Web bezeichne...

Grundstrich
Der Begriff des Grundstrichs im Bereich der Typografie, bezeichnet den senkrechten Strich der Buchstaben. Bei Schriftarten mit variabler Strichstärke, wie zum Beispi...

Application Server
Ein Application Server, zu deutsch Anwedungsserver, ist ein Netzwerkrechner (Server) auf dem verschiedenste Anwendungsprogramme ausgeführt werden können. Der Be...