Neuigkeiten
  • Die modified eCommerce Shopsoftware ist kostenlos, aber nicht umsonst.
    Spenden
  • Damit wir die modified eCommerce Shopsoftware auch zukünftig kostenlos anbieten können:
    Spenden
  • Thema: robots.txt: warum wird das Template verboten?

    web0null

    • Experte
    • Beiträge: 1.998
    Re: robots.txt: warum wird das Template verboten?
    Antwort #15 am: 29. August 2014, 13:07:07
    Zitat
    Wenn ihr das Crawling einiger dieser Dateien nicht gestattet oder wenn sie über einen Server eines Drittanbieters eingebettet werden, der das Crawling durch den Googlebot unterbindet, können wir euch die Dateien nicht in der gerenderten Ansicht zeigen.

    Das heißt nur, dass es "nicht in der gerenderten Ansicht" angezeigt wird, nicht mehr und nicht weniger.
    Das heißt nicht, Google kann es nicht.
    Oder anders, das heißt nur, Google zeigt es euch einfach nicht, obwohl er es trotzdem analysiert.

    Oder glaubt jemand im ernst, Google interessiert es wirklich was man in die robots.txt schreibt.
    Ich meine, klar hält er sich daran, wenn um Seiten geht die man nicht im Index haben will.
    Aber für SEINE internen Analysen, wird er sich wohl kaum etwas vorschreiben lassen.  ;-)

    Wenn das so wäre hätten die Spammer ein leichtes Spiel.

    Es ist doch ganz einfach, alles was man als normaler Benutzer sieht, sieht (und analysiert) auch Google.

    ...auch wenn er selber manchmal behauptet er könne es nicht, wie z.B. mit diesem Satz (Quelle)
    Zitat
    Wenn Ressourcen wie JavaScript oder CSS in separaten Dateien blockiert werden, z. B. in robots.txt, damit der Googlebot sie nicht abrufen kann, kann unser Indexierungssystem eure Websites nicht wie ein normaler Nutzer abrufen.
    joo klar. :doh:

    Wenn sie wenigstens geschrieben hätten
    Zitat
    blockiert werden ... über die .htaccess

    dann ist es klar, aber
    Zitat
    blockiert werden ... über die  robots.txt

    ist doch lächerlich, zu sagen man könne es nicht abrufen.

    Gruß
    rechtstexte für onlineshop

    voodoopupp

    • Fördermitglied
    • Beiträge: 1.868
    • Geschlecht:
    Re: robots.txt: warum wird das Template verboten?
    Antwort #16 am: 01. September 2014, 09:57:48
    Grundsätzlich würde mich das auch stark interessieren.

    Eigentlich ist es ja auch nicht soo wichtig zu wissen, ob google das kann oder nicht. Das kann sich ja jeder selber denken ;)

    Die Frage ist eher: ist es besser oder schlechter, den Ordner "templates" aus der robots.txt zu entfernen?!

    Auch würde mich die "geschichtliche" Eintragung des Ordners interessieren, die Alfred angesprochen hat.

    Grüße
    Dominik

    noRiddle (revilonetz)

    • Experte
    • Beiträge: 13.975
    • Geschlecht:
    Re: robots.txt: warum wird das Template verboten?
    Antwort #17 am: 02. September 2014, 00:28:17
    Fakt scheint ja wirklich zu sein:
    Google behauptet die robots.txt würde von Ihnen respektiert, akzeptieren wir einfach so,
    bringt ja auch nichts wenn sie es mit schlechteren SERPS bestrafen würden.
    Wußte ich auch nicht und habe wieder was gelernt.

    Wie bereits in einem fürheren Post gesagt
    "Im übrigen enthält der Template-Ordner ja noch eine htaccess die auf alle *.html und *.php-Dateien den Zugriff verbietet, sodaß die robots.txt des Eintrages Disallow: /templates/ ohnehin eigentlich nicht bedürfte."

    Also löscht es doch einfach raus.

    Gruß,
    noRiddle

    Guenter59

    • Viel Schreiber
    • Beiträge: 1.484
    Re: robots.txt: warum wird das Template verboten?
    Antwort #18 am: 02. September 2014, 23:01:15
    High
    Zitat
    Die Frage ist eher: ist es besser oder schlechter, den Ordner "templates" aus der robots.txt zu entfernen?!
    Ich habe es vor ca 2 Wochen gemacht.
    Bei " Abruf wie durch Google " stand da viórher ' Teilweise ', jetzt abgeschlossen und die Seite wird in der Vorschau richtig angezeigt.

    Bei den Suchpositionen hat sich nichts verändert und auch die Anzahl der indexierten Seiten hat sich nicht verändert.
    Im Prinzip hat sich also nichts Relevantes verändert.

    GMS

    Godzilla

    • Schreiberling
    • Beiträge: 489
    Re: robots.txt: warum wird das Template verboten?
    Antwort #19 am: 03. September 2014, 03:29:18
    Hi,
    ich wollte hier mal eine Diskussion vom Zaun brechen, warum eigentlich in der Robots.txt der Zugriff auf den Template Ordner verboten wird. Kann jemand dafür einen triftigen Grund nennen ?

    Der Bot würde sich dann unnötig verrennen und da jeder Seite nur ein bestimmtes Crawling-Kontingent zugestanden wird, hat das dann negative (oder besser weniger positive) Folgen für den Content den man indexiert und wahrscheinlich möglichst häufig gecrawlt sehen möchte.

    Wie bereits in einem fürheren Post gesagt
    "Im übrigen enthält der Template-Ordner ja noch eine htaccess die auf alle *.html und *.php-Dateien den Zugriff verbietet, sodaß die robots.txt des Eintrages Disallow: /templates/ ohnehin eigentlich nicht bedürfte."

    Also löscht es doch einfach raus.

    Klar. Das kommt sicher ganz gut bei Suchmaschinen an, weil die dann nicht nur permanent unnötig Dateien anfordern und vom Server abgewiesen werden sondern auch noch permanent testen müssen warum da mindestens ein Ordner existiert, welcher in der robot.txt ausdrücklich nicht verboten wurde, ausgerechnet für deren Bot gesperrt ist.

    Umsatz, Umsatz, Umsatz! Traffic, Traffic, Traffic!

    Zitat
    Wenn ihr das Crawling einiger dieser Dateien nicht gestattet oder wenn sie über einen Server eines Drittanbieters eingebettet werden, der das Crawling durch den Googlebot unterbindet, können wir euch die Dateien nicht in der gerenderten Ansicht zeigen.

    Das heißt nur, dass es "nicht in der gerenderten Ansicht" angezeigt wird, nicht mehr und nicht weniger.
    Das heißt nicht, Google kann es nicht.
    Oder anders, das heißt nur, Google zeigt es euch einfach nicht, obwohl er es trotzdem analysiert.

    Oder glaubt jemand im ernst, Google interessiert es wirklich was man in die robots.txt schreibt.
    Ich meine, klar hält er sich daran, wenn um Seiten geht die man nicht im Index haben will.
    Aber für SEINE internen Analysen, wird er sich wohl kaum etwas vorschreiben lassen.  ;-)

    Wenn das so wäre hätten die Spammer ein leichtes Spiel.

    Diese Spammer benutzen dafür dann aber eine htaccess...

    Es ist doch ganz einfach, alles was man als normaler Benutzer sieht, sieht (und analysiert) auch Google.

    ...auch wenn er selber manchmal behauptet er könne es nicht, wie z.B. mit diesem Satz (Quelle)
    Zitat
    Wenn Ressourcen wie JavaScript oder CSS in separaten Dateien blockiert werden, z. B. in robots.txt, damit der Googlebot sie nicht abrufen kann, kann unser Indexierungssystem eure Websites nicht wie ein normaler Nutzer abrufen.
    joo klar. :doh:

    Wenn sie wenigstens geschrieben hätten
    Zitat
    blockiert werden ... über die .htaccess

    dann ist es klar, aber
    Zitat
    blockiert werden ... über die  robots.txt

    ist doch lächerlich, zu sagen man könne es nicht abrufen.

    Und wer ist jetzt "man"? "Google inc.", "der Googlebot" oder "Googles Indexierungssystem"?

    High
    Zitat
    Die Frage ist eher: ist es besser oder schlechter, den Ordner "templates" aus der robots.txt zu entfernen?!
    Ich habe es vor ca 2 Wochen gemacht.
    Bei " Abruf wie durch Google " stand da viórher ' Teilweise ', jetzt abgeschlossen und die Seite wird in der Vorschau richtig angezeigt.

    Bei den Suchpositionen hat sich nichts verändert und auch die Anzahl der indexierten Seiten hat sich nicht verändert.
    Im Prinzip hat sich also nichts Relevantes verändert.

    Probleme beim " Abruf wie durch Google " könnte man auch mit einer Positivliste lösen.

    web0null

    • Experte
    • Beiträge: 1.998
    Re: robots.txt: warum wird das Template verboten?
    Antwort #20 am: 03. September 2014, 03:56:28
    Also, ich schrieb,
    Zitat
    ist doch lächerlich, zu sagen man könne es nicht abrufen.

    Du fragst,
    Zitat
    Und wer ist jetzt "man"? "Google", "der Googlebot" oder "Googles Indexierungssystem"?
    Wieso? Hat der "Googlebot" mit dir schon mal gesprochen??

    Also zu mir jedenfalls, hat "der Googlebot" oder "Googles Indexierungssystem" noch nie gesprochen. :whistle:
    ...ich glaube ja es könnte daran liegen, dass die "2" immer noch "Scripte" bzw. "Programme" sind, und ich glaube die können noch nicht reden. :blower:

    Gruß

    Godzilla

    • Schreiberling
    • Beiträge: 489
    Re: robots.txt: warum wird das Template verboten?
    Antwort #21 am: 03. September 2014, 17:57:12
    Also, ich schrieb,
    Zitat
    ist doch lächerlich, zu sagen man könne es nicht abrufen.

    Du fragst,
    Zitat
    Und wer ist jetzt "man"? "Google", "der Googlebot" oder "Googles Indexierungssystem"?
    Wieso? Hat der "Googlebot" mit dir schon mal gesprochen??

    Also zu mir jedenfalls, hat "der Googlebot" oder "Googles Indexierungssystem" noch nie gesprochen. :whistle:
    ...ich glaube ja es könnte daran liegen, dass die "2" immer noch "Scripte" bzw. "Programme" sind, und ich glaube die können noch nicht reden. :blower:

    Du schreibst:
    Zitat
    Zitat
    Wenn Ressourcen wie JavaScript oder CSS in separaten Dateien blockiert werden, z. B. in robots.txt, damit der Googlebot sie nicht abrufen kann, kann unser Indexierungssystem eure Websites nicht wie ein normaler Nutzer abrufen.
    joo klar. :doh: ... ist doch lächerlich, zu sagen man könne es nicht abrufen.

    1. Da steht NICHT, dass "man" es nicht abrufen kann.
    2. Da steht NICHT, dass "der Googlebot" es nicht abrufen kann.
    3. Da steht NICHT, dass "Google inc." es nicht abrufen kann.
    4. Da steht NICHT, dass "Googles Indexierungssystem" es nicht abrufen kann.

    Ich hatte gefragt wer mit "man" gemeint ist um zu verstehen wer denn nun behauptet haben soll, dass man es nicht abrufen könne. Da Skripte mit dir nicht sprechen soll es dann ja angeblich Google behauptet haben. Kannst du das mit einer Quelle belegen oder behauptest du das einfach mal?

    noRiddle (revilonetz)

    • Experte
    • Beiträge: 13.975
    • Geschlecht:
    Re: robots.txt: warum wird das Template verboten?
    Antwort #22 am: 03. September 2014, 18:16:09
    ...
    Wie bereits in einem fürheren Post gesagt
    "Im übrigen enthält der Template-Ordner ja noch eine htaccess die auf alle *.html und *.php-Dateien den Zugriff verbietet, sodaß die robots.txt des Eintrages Disallow: /templates/ ohnehin eigentlich nicht bedürfte."

    Also löscht es doch einfach raus.

    Klar. Das kommt sicher ganz gut bei Suchmaschinen an, weil die dann nicht nur permanent unnötig Dateien anfordern und vom Server abgewiesen werden sondern auch noch permanent testen müssen warum da mindestens ein Ordner existiert, welcher in der robot.txt ausdrücklich nicht verboten wurde, ausgerechnet für deren Bot gesperrt ist.

    Umsatz, Umsatz, Umsatz! Traffic, Traffic, Traffic!
    ...

    Du scheinst über tiefere Erkenntnisse über die Arbeitsweise eines Suchmaschinen-Bots zu haben, lass uns nicht dumm sterben...

    Gruß,
    noRiddle

    web0null

    • Experte
    • Beiträge: 1.998
    Re: robots.txt: warum wird das Template verboten?
    Antwort #23 am: 03. September 2014, 18:59:26
    Zitat
    Kannst du das mit einer Quelle belegen oder behauptest du das einfach mal?
    Hallooo, kannst du lesen, und weißt du wie ein Link aussieht?

    Zitat
    Ich hatte gefragt wer mit "man" gemeint ist um zu verstehen wer denn nun behauptet haben soll, dass man es nicht abrufen könne.

    Ok nochmal,

    Ich zitiere mich nochmal selbst

    ...auch wenn er selber manchmal behauptet er könne es nicht, wie z.B. mit diesem Satz (Quelle)
    Zitat
    Wenn Ressourcen wie JavaScript oder CSS in separaten Dateien blockiert werden, z. B. in robots.txt, damit der Googlebot sie nicht abrufen kann, kann unser Indexierungssystem eure Websites nicht wie ein normaler Nutzer abrufen.
    Da ist die "Quelle" angegeben.
    Von dort habe ich diesen Satz, und da steht Sinngemäß (für dich rot eingefärbt) der Googlebot könne es nicht abrufen.
    Oder was liest du bitteschön?

    Durch die Angabe der "Quelle" ist doch klar wer mit "man" gemeint ist, bzw. wer das behauptet.

    Gruß

    web0null

    • Experte
    • Beiträge: 1.998
    Re: robots.txt: warum wird das Template verboten?
    Antwort #24 am: 03. September 2014, 19:37:47
    Zitat
    Klar. Das kommt sicher ganz gut bei Suchmaschinen an, weil die dann nicht nur permanent unnötig Dateien anfordern und vom Server abgewiesen werden sondern auch noch permanent testen müssen warum da mindestens ein Ordner existiert, welcher in der robot.txt ausdrücklich nicht verboten wurde, ausgerechnet für deren Bot gesperrt ist.

    Ich übersetze mal,

    Klar. Das kommt sicher ganz gut beim Einbrecher an, weil der dann nicht nur permanent unnötig die Sicherheitstür versucht auf zu bekommen, und von der Sicherheitstür immer wieder abgewiesen wird...

    Sondern er muss auch noch permanent testen, warum da mindestens eine Tür existiert, welche nicht auf einem Schild aufgeführt ist, wo klar darauf steht, dass es verboten ist durch diese Sicherheitstür einzubrechen, bzw. nicht angeführt wurde, dass sie ausgerechnet für diesen Einbrecher versperrt ist.

    Das mit dem "Einbrecher" ist aber nur ein Beispiel, gelle ;-)
    Gruß

    fishnet

    • Fördermitglied
    • Beiträge: 4.821
    • Geschlecht:
    Re: robots.txt: warum wird das Template verboten?
    Antwort #25 am: 03. September 2014, 20:07:37
     :popcorn:
    Also bei mir is inzwischen allet schick, aber macht ruhig weiter, dann hat man was zum Schmunzeln...
     :keks:

    Godzilla

    • Schreiberling
    • Beiträge: 489
    Re: robots.txt: warum wird das Template verboten?
    Antwort #26 am: 03. September 2014, 22:36:38

    Ok nochmal,

    Ich zitiere mich nochmal selbst

    ...auch wenn er selber manchmal behauptet er könne es nicht, wie z.B. mit diesem Satz (Quelle)
    Zitat
    Wenn Ressourcen wie JavaScript oder CSS in separaten Dateien blockiert werden, z. B. in robots.txt, damit der Googlebot sie nicht abrufen kann, kann unser Indexierungssystem eure Websites nicht wie ein normaler Nutzer abrufen.
    Da ist die "Quelle" angegeben.
    Von dort habe ich diesen Satz, und da steht Sinngemäß (für dich rot eingefärbt) der Googlebot könne es nicht abrufen.
    Oder was liest du bitteschön?

    Ich lese dort, dass das Google Indexierungssystem eine Website nicht wie ein normaler Nutzer abrufen kann, wenn für den Googlebot der Zugriff auf notwendige separate Dateien blockiert wird.

    Selbstverständlich ist die Google inc. technisch in der Lage den Googlebot so umzuprogrammieren, dass er die technischen Richtlinien für den Umgang mit robot.txt-Dateien ignoriert, aber ich kann mir nicht vorstellen, das die Google inc. ein Interesse daran hat, dass ihr Googlebot als ein sog. Bad Bot agiert und eingestuft wird.

    Zitat
    Klar. Das kommt sicher ganz gut bei Suchmaschinen an, weil die dann nicht nur permanent unnötig Dateien anfordern und vom Server abgewiesen werden sondern auch noch permanent testen müssen warum da mindestens ein Ordner existiert, welcher in der robot.txt ausdrücklich nicht verboten wurde, ausgerechnet für deren Bot gesperrt ist.

    Ich übersetze mal,

    Klar. Das kommt sicher ganz gut beim Einbrecher an, weil der dann nicht nur permanent unnötig die Sicherheitstür versucht auf zu bekommen, und von der Sicherheitstür immer wieder abgewiesen wird...

    Sondern er muss auch noch permanent testen, warum da mindestens eine Tür existiert, welche nicht auf einem Schild aufgeführt ist, wo klar darauf steht, dass es verboten ist durch diese Sicherheitstür einzubrechen, bzw. nicht angeführt wurde, dass sie ausgerechnet für diesen Einbrecher versperrt ist.

    Das mit dem "Einbrecher" ist aber nur ein Beispiel, gelle ;-)
    Gruß

    Hier als Beispiel mal drei solcher Standard-"Türen":
    Code: PHP  [Auswählen]
    <link rel="shortcut icon" href="https://demo.modified-shop.org/tags/modified-1.06/templates/xtc5/favicon.ico" type="image/x-icon" />
    <link rel="stylesheet" href="templates/xtc5/stylesheet.css" type="text/css" />
    <link rel="stylesheet" href="templates/xtc5/css/thickbox.css" type="text/css" media="screen" />
     

    Ich übersetze mal:

    Liebe "Einbrecher",

    Ich habe jetzt zwar extra in der robot.txt ("aus Sicherheitsgründen") verschwiegen, dass es das Verzeichnis "templates/xtc5/" gibt, aber das favicon befindet sich überraschender Weise nicht im Rootverzeichnis sondern in einem ganz geheimen Ordner Namens "templates/xtc5/".

    ...
    Wie bereits in einem fürheren Post gesagt
    "Im übrigen enthält der Template-Ordner ja noch eine htaccess die auf alle *.html und *.php-Dateien den Zugriff verbietet, sodaß die robots.txt des Eintrages Disallow: /templates/ ohnehin eigentlich nicht bedürfte."

    Also löscht es doch einfach raus.

    Klar. Das kommt sicher ganz gut bei Suchmaschinen an, weil die dann nicht nur permanent unnötig Dateien anfordern und vom Server abgewiesen werden sondern auch noch permanent testen müssen warum da mindestens ein Ordner existiert, welcher in der robot.txt ausdrücklich nicht verboten wurde, ausgerechnet für deren Bot gesperrt ist.

    Umsatz, Umsatz, Umsatz! Traffic, Traffic, Traffic!
    ...

    Du scheinst über tiefere Erkenntnisse über die Arbeitsweise eines Suchmaschinen-Bots zu haben, lass uns nicht dumm sterben...

    Gruß,
    noRiddle

    http://bit.ly/1r30YG7

    web0null

    • Experte
    • Beiträge: 1.998
    Re: robots.txt: warum wird das Template verboten?
    Antwort #27 am: 04. September 2014, 15:12:08
    Bitte, du musst nicht immer alles komplett zitieren.

    Zitat
    Ich lese dort, ... nicht wie ein normaler Nutzer abrufen kann...
    Genau... und ich sagte,
    ist doch lächerlich, zu "sagen, behaupten, schreiben" man könne es nicht abrufen.
    Nicht mehr und nicht weniger, aber ist egal ich glaube auch wenn ich es dir noch 100 mal erkläre, du verstehst es einfach nicht.

    Zitat
    Selbstverständlich ist die Google inc. technisch in der Lage den Googlebot so umzuprogrammieren...
    ...
    aber ich kann mir nicht vorstellen, das die Google inc. ein Interesse daran hat, dass ihr Googlebot als ein sog. Bad Bot agiert...

    Oh Mann,
    1. "umzuprogrammieren", die müssen nichts umprogrammieren ;-)
    2. "als ein sog. Bad Bot agiert", ich denke ein Unternehmen, was u.a. die (bzw. alle) E-Mails seiner Kunden ausspioniert, hat kein Problem wenn manche glauben er betreibe einen "Bad Bot".

    Man kann aber auch Google den rücken kehren. :lol:

     

    Godzilla

    • Schreiberling
    • Beiträge: 489
    Re: robots.txt: warum wird das Template verboten?
    Antwort #28 am: 04. September 2014, 16:41:17
    Bitte, du musst nicht immer alles komplett zitieren.

    Zitat
    Ich lese dort, ... nicht wie ein normaler Nutzer abrufen kann...
    Genau... und ich sagte,
    ist doch lächerlich, zu "sagen, behaupten, schreiben" man könne es nicht abrufen.
    Nicht mehr und nicht weniger, aber ist egal ich glaube auch wenn ich es dir noch 100 mal erkläre, du verstehst es einfach nicht.

    Auch wenn ich mich wiederhole: Wer ist denn nun "man"?
    Ich glaube, dass du diesen einfachen Satz von Google nicht verstehen kannst oder eher auf Grund deiner unkonstruktiven kritischen Haltung gegenüber Google einfach nicht verstehen willst.

    Zitat
    Selbstverständlich ist die Google inc. technisch in der Lage den Googlebot so umzuprogrammieren...
    ...
    aber ich kann mir nicht vorstellen, das die Google inc. ein Interesse daran hat, dass ihr Googlebot als ein sog. Bad Bot agiert...

    Oh Mann,
    1. "umzuprogrammieren", die müssen nichts umprogrammieren ;-)
    2. "als ein sog. Bad Bot agiert", ich denke ein Unternehmen, was u.a. die (bzw. alle) E-Mails seiner Kunden ausspioniert, hat kein Problem wenn manche glauben er betreibe einen "Bad Bot".

    zu 1.)
    Ist dir der Quellcode des Googlebots bekannt? Dann mach doch auf Wistleblower und sei weltweit die erste Person welche belegen kann, dass der Googlebot sich nicht an klar definierte Standards hält.

    zu 2.)
    Googlemail "spioniert" kein Mails aus, weil alle Kunden darüber informiert sind, dass diese Dienstleistung kostenlos ist und damit finanziert wird, dass Mails von Computer mitgelesen werden und zu passenen Schlüsselwörtern dann Werbung an Personen ausgeliefert wird, welche die kostenlose Dienste der Google inc. in Anspruch nehmen.

    Desweiteren wird durch deine Aussage über Googles "geheime Bad Bots" nur wieder deutlich, dass du diesen Einzeiler nicht verstanden hast. Ich hatte daher mehrmals nachgefragt.

    Zitat
    Wenn Ressourcen wie JavaScript oder CSS in separaten Dateien blockiert werden, z. B. in robots.txt, damit der Googlebot sie nicht abrufen kann, kann unser Indexierungssystem eure Websites nicht wie ein normaler Nutzer abrufen.

    Vieleicht verstehst du es so besser:
    Code: PHP  [Auswählen]
    "der Googlebot" != "unser Indexierungssystem"
    "der Googlebot" != "normaler Nutzer"
    "der Googlebot" != "Google inc."
    "unser Indexierungssystem" != "Google inc."
    "man" != "Google inc."
     

    noRiddle (revilonetz)

    • Experte
    • Beiträge: 13.975
    • Geschlecht:
    Re: robots.txt: warum wird das Template verboten?
    Antwort #29 am: 04. September 2014, 17:07:38
    @Godzilla
    Was wolltest du mir eigtl. mit dem hier geposteten Such-Link sagen ?
    Daß nun alle möglichen Dateien, einschließlich mail.txt-Dateien in den Suchergebnissen zu finden sind wenn man /templates/ nicht in die robots.txt als "Dissallow" setzt ?

    Meine Frage war eigtl. ob du tiefere Erkenntnisse über die Arbeitsweise des G.-Bots hast.
    Deine lapidare Antwort zeigt lediglich, daß es nicht sinnvoll ist den Ordner /templates/ einfach aus der robots.txt rauszunehmen.

    Nach deiner Aussage:
    Zitat
    Klar. Das kommt sicher ganz gut bei Suchmaschinen an, weil die dann nicht nur permanent unnötig Dateien anfordern und vom Server abgewiesen werden sondern auch noch permanent testen müssen warum da mindestens ein Ordner existiert, welcher in der robot.txt ausdrücklich nicht verboten wurde, ausgerechnet für deren Bot gesperrt ist.
    müsste man ja die robots.txt in der Art aufbauen was den Ordner /templates/ betrifft:
    Disallow: /templates/YOUR_TEMPLATE/admin/
    Disallow: /templates/YOUR_TEMPLATE/boxes/
    Disallow: /templates/YOUR_TEMPLATE/mail/
    Disallow: /templates/YOUR_TEMPLATE/module/
    Disallow: /templates/YOUR_TEMPLATE/smarty/
    Disallow: /templates/YOUR_TEMPLATE/source/
    also alle Ordner die nicht /javascript/ oder /css/ oder /button/ oder /img/ heißen erfassen. (ich nehme mal an, daß auch die Bilder und Buttons - wenn in der htaccess gesperrt - vom G.-Bot nicht erfasst werden ?)

    Mein Fazit:
    Das Ganze ist bislang undurchsichtig und unlogisch und noch lange nicht geklärt.

    Gruß,
    noRiddle

    4 Antworten
    3173 Aufrufe
    24. Mai 2013, 09:50:39 von ams
    21 Antworten
    8613 Aufrufe
    04. Oktober 2012, 04:40:22 von Simon
    0 Antworten
    42475 Aufrufe
    15. Dezember 2009, 21:05:49 von Tomcraft
    2 Antworten
    1807 Aufrufe
    16. November 2018, 16:48:50 von Timm