Dank der wie immer freundlichen und kompetenten Hilfe von Herrn Debik von Bitpalast, scheint das Problem nun vorerst für mich gelöst. Kann den Anbieter nur empfehlen, da der server auch durch den nginx Reverse proxy extrem schnell ist. (Keine Werbung sondern meine unbezahlte Meinung)
Ich konnte über utrace etc nach Eingabe der IP Adressen keine Signaturen erkennen, aber Herr Debik hat sich das dann mal näher angeschaut.
Ich habe mir Ihre Log-Dateien angeschaut und dort eigentlich vier immer wieder auftretende Signaturen der Problem-Aufrufer gefunden:
LieBaoFast
zh_CN
zh-CN
Mb2345Browser
zh_CN und zh-CN sind eigentlich keine Signaturen, aber Sprach-Kennungen. Diese kann man aber auch nutzen, um die Aufrufer auszuschließen. Ich habe nun an den Anfang Ihrer .htaccess-Datei einerseits den Schutz gegen Badbots eingefügt (denn auch Semrush etc. besucht Ihre Website häufig gemäß Logdateien), aber an den Anfang die vier Problem-Aufrufer ebenfalls eingefügt. Seither antwortet der Webserver dorthin mit einem allgemeinen Serverfehler und rendert hier keine Seiten. Andere Aufrufe funktionieren trotzdem weiterhin wie gewohnt.
Daraufhin haben wir in der .htaccess des shoproots folgendes ganz oben eingegeben:
RewriteEngine On
RewriteBase /
RewriteCond %{HTTP_USER_AGENT} (LieBaoFast|zh_CN|zh-CN|Mb2345Browser|seocompany|SEOkicks|Uptimebot|Cliqzbot|ssearch_bot|domaincrawler|AhrefsBot|spot|DigExt|Sogou|MegaIndex.ru|majestic12|80legs|SISTRIX|HTTrack|Semrush|MJ12|MJ12bot|MJ12Bot|Ezooms|CCBot|TalkTalk|Ahrefs|BLEXBot) [NC]
RewriteRule .* - [F]
Daraufhin konnte man unter whos online keine Zugriffe von chinesischen IPs mehr feststellen.
Allerdings wurde danach das error_log des servers (nicht das des shops) immer größer, weil die IPs wohl einen 403 Fehler bekamen, aber auf die Sitemap weitergeleitet wurden und erst nach 10 mal redirect auf die selbe das ganze mit einer Fehlermeldung im error_log aufhörte.
[Tue Nov 26 12:47:46.564729 2019] [core:error] [pid 3199] [client 46.229.168.142:40090] AH00124: Request exceeded the limit of 10 internal redirects due to probable configuration error. Use 'LimitInternalRecursion' to increase the limit if necessary. Use 'LogLevel debug' to get a backtrace.
Timo hat mir dann auf die schnelle in der .htaccess die Zeile 123
ErrorDocument 403 /sitemap.html?error=403
geändert zu
#ErrorDocument 403 /sitemap.html?error=403 # prevent recall from 403 RewriteRule's
Dadurch werden die chinesischen IPs nicht mehr weitergeleitet auf die Sitemap sondern bekommen gleich die 403 Seite des Servers zu Gesicht. Dadurch gibt es keine Einträge mehr im error_log sondern nur noch einen einzigen Eintrag im Serverprotokoll.
2019-11-26 15:46:59 Error 120.7.234.117 403 GET /Buendchen/Buendchen-Meliert:::16_26.html?MODsid=xyz HTTP/1.0
Das ganze scheint genauso schnell wie vorher zu sein.
Fragen an die Wissenden:
1) Ist das so ok, oder noch optimierbar?
2) Ist das auskommentieren der 403 Weiterleitung in Ordnung oder anders besser?
3) Kann man an den vielen redirects auf die Sitemap eine allgemeine Verbesserung der .htaccess ableiten, die für alle sinnvoll wäre? Dann würde ich dazu ein Ticket aufmachen.
Gruß Timm