rechtstexte für onlineshop
Neuigkeiten
  • Die modified eCommerce Shopsoftware ist kostenlos, aber nicht umsonst.
    Spenden
  • Damit wir die modified eCommerce Shopsoftware auch zukünftig kostenlos anbieten können:
    Spenden
  • Thema: Druckansicht im Google Index trotz Disallow: /print_product_info.php

    deepblue

    • Schreiberling
    • Beiträge: 291
    • Geschlecht:
    Hallo,

    wir haben folgendes Problem:

    Google hat über 1.050 Druckseiten im Google Index von insgesamt 1.950 Ergebnissen. Wir haben schon folgenden Eintrag (Disallow: /print_product_info.php) in der robots.txt stehen.

    Wie kann man das verhindern, dass Google die Druckseiten spidert?  :?



    Linkback: https://www.modified-shop.org/forum/index.php?topic=10774.0

    Tomcraft

    • modified Team
    • Gravatar
    • Beiträge: 46.343
    • Geschlecht:
    Es wundert mich, dass die überhaupt drin stehen, trotz "Disallow: /print_product_info.php" in der "robots.txt".

    Mal schauen, was die anderen für Ideen haben. :?

    Grüße

    Torsten

    atmiral

    • Neu im Forum
    • Beiträge: 34
    • Geschlecht:
    Hallo,

    ich hatte schon einen änlichen Fall. Das Problem liegt wahrscheinlich nicht an robots.txt
    robots.txt hat keinen "absoluten" Priorität für Google & Co.
    Anscheinend durch falsche/widersprächende Angaben im Header anderer Seiten findet google keinen besseren Content und spidert die Druckseiten der Produkte.

    Um eine qualifizierte Aussage zu machen, sollte man die Seiten analysieren.

    Matt

    • Experte
    • Beiträge: 4.241
    Google respektiert nach eigenen Angaben die robots.txt. Wie sieht so eine URL eigentlich mit SEO-URLs aus? Nutze das ja so gar nicht, diese komische Druckansicht.
    Was unabhängig davon hilft:

    Code: XML  [Auswählen]
    <meta name='robots' content='noindex,follow' />
    <meta name='googlebot' content='noindex,follow' />
    in den <head>-Bereich.

    atmiral

    • Neu im Forum
    • Beiträge: 34
    • Geschlecht:
    ...mal anders rum gedacht? Wenn das mit dem robots.txt und sperren der Druckseiten klappte. Wäre als Ergebnis so ca 900 (1950 - 1050) Seiten im Index.

    Ist es das was Du erreichen möchtest? Sind dann die Seiten die im Google-Index bleiben die richtigen?

    GTB

    • modified Team
    • Gravatar
    • Beiträge: 6.294
    • Geschlecht:
    Hallo deepblue,

    wenn es um den Büroartikelshop geht, dann finde ich keine einzige Druckansicht im Index !

    Gruss Gerhard

    deepblue

    • Schreiberling
    • Beiträge: 291
    • Geschlecht:
    Probier es mal über Google

    site:http://www.bueroartikel24.de/print_product_info.php
    Zitat
    Ergebnis: Ungefähr 1.050 Ergebnisse von Druckseiten

    Tomcraft

    • modified Team
    • Gravatar
    • Beiträge: 46.343
    • Geschlecht:
    Ich finde genau ein Vorkommen:

      [ Für Gäste sind keine Dateianhänge sichtbar ]

    Grüße

    Torsten

    Alfred

    • Experte
    • Beiträge: 2.115
    Hallo,

    unterscheiden wir mal 2 Fälle.

    a. Druckseiten sind im Index

    Damit sie dort nicht mehr erscheinen reicht es, wie matt schrieb, für ein noindex zu sorgen.
    Aber bitte nur auf der Druckansicht.

    Was machen aber Suchende bei Google die auf solch eine Seite kommen?
    Entweder kürzen die die Adresse bis zum Domainnamen oder die sind wieder weg.
    Die Lösung ist die Artikelüberschrift und die Bilder auf die richtige Artikelseite zu verlinken.
    Damit kann der Suchende dort hin wo er sein will.

    Was soll Google machen? Die sollen die Druckseite durch die Produktseite ersetzen.
    Das erreicht man indem in die Druckansicht canonical eingebaut wird zur Artikelseite.

    b. Druckseiten sind nicht im Index

    noindex einbauen in die Druckansicht und rel="nofollow" beim Link zur Druckansicht.

    Noch etwas zur robots.txt.
    Google nimmt die sehr ernst.
    Die erste Datei die sich Google immer holt ist die robots.txt.

    http://www.google.com/support/webmasters/bin/answer.py?hl=de&answer=156449&from=35237&rd=1

    Gruß

    Alfred

    • Experte
    • Beiträge: 2.115
    Hallo Torsten,

    http://bit.ly/fmuuOC

    Gruß

    Tomcraft

    • modified Team
    • Gravatar
    • Beiträge: 46.343
    • Geschlecht:
    Danke Alfred... :doh: :datz:

    Manchmal sollte man auch lesen, was auf dem Bildschirm steht:
    Zitat
    Um Ihnen nur die treffendsten Ergebnisse anzuzeigen, wurden einige Einträge ausgelassen, die den 1 bereits angezeigten Treffern sehr ähnlich sind.
    Sie können bei Bedarf die Suche unter Einbeziehung der übersprungenen Ergebnisse wiederholen.
    Grüße

    Torsten

    Matt

    • Experte
    • Beiträge: 4.241
    Noch etwas zur robots.txt.
    Google nimmt die sehr ernst.
    Die erste Datei die sich Google immer holt ist die robots.txt.

    Ja, aber manchmal ist die Diva etwas eigen und hätte gern eine persönliche Ansprache. Deshalb auch die metas in meinem Beispiel oben doppelt.

    Anonym

    • Gast
    Hallo,

    ich behaupte, die robots.txt hat es nicht immer gegeben bzw. die print_product_info.phop war nicht immer gesperrt.
    Irgendwo muss die G das ja her haben.

    Ansonsten ist das Verhalten von G richtig, es erscheinen keine Snippets in den Serps, der Content ist nicht (mehr) indexiert.
    Was sagen denn die Webmaster-Tools über Crawling-Fehler?

    Gruß
     Kristian

    Anonym

    • Gast
    Hallo,

    Ja, aber manchmal ist die Diva etwas eigen und hätte gern eine persönliche Ansprache. Deshalb auch die metas in meinem Beispiel oben doppelt.

    die Sache mit der persönlichen Ansprache ist IMHO Schnee von gestern.
    Wenn ja dann sollte in der robots.txt alles was für User-agent: * steht nochmal für User-agent: Google-Bot stehen.
    Die Angabe in den Meta-Tags hilft, wenn man vorher den Fehler in der robots.txt hatte.
    Dann setzt man die Metas und ändert die robots.txt erst wenn G. das gerafft hat.

    Gruß
     Kristian

    deepblue

    • Schreiberling
    • Beiträge: 291
    • Geschlecht:
    @ kristian

    Die "robots.txt" wurde nicht nachträglich geändert. Der Eintrag stand schon immer so in der "robots.txt":

    Disallow: /print_product_info.php
    7 Antworten
    3356 Aufrufe
    04. September 2010, 20:18:01 von guensi
    12 Antworten
    3546 Aufrufe
    01. Mai 2010, 18:24:11 von guensi