Was ist mit inktomisearch.com los?

oli181

Angesehenes Mitglied
Hallo zusammen

Seit einiger Zeit habe ich seltsame Log-Einträge von inktomisearch.com:

lj1331.inktomisearch.com - - [20/Oct/2004:09:29:53 +0200] "GET /einzelansicht%2Cparties%2Ccill_riverside03%2CDSC00469.JPG%2C2/march.htm HTTP/1.0" 404 1058 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)"
lj1345.inktomisearch.com - - [20/Oct/2004:09:32:56 +0200] "GET /fotos%2Ceinzelansicht%2Cparties%2Ccill_riverside03%2CDSC00470.JPG%2C2.htm HTTP/1.0" 404 1058 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)"
lj1249.inktomisearch.com - - [20/Oct/2004:09:33:40 +0200] "GET /fotos%2Ceinzelansicht%2Cfestivals%2Cgurten03%2CDSC00672.jpg%2C5.htm HTTP/1.0" 404 1058 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)"

eine solche URL existierte noch nie auf meinem Server. Korrekt wäre z.B.:

fotos%2Ceinzelansicht%2Cparties%2Ccill_riverside03%2CDSC00470.JPG%2C2.htm

Sind solche Zugriffe mit frei erfundenen Zusätzen in der URL normal? Weiss jemand wieso inktomisearch.com das macht?

Danke & Gruss

Oliver
 
Hallo Oli

Ist dein Html Code valid? Es könnte sein, dass der Spider Probleme hat ihn zu parsen und deshalb falsche Links ausliest.

QUOTE /einzelansicht%2Cparties%2Ccill_riverside03%2CDSC00469.JPG%2C2/march.htm
Ist das ein Einzellfall?

alain
 
Hmmm... Ich weiss von keiner Seite, die so verlinkt. Es gab auch noch nie eine Seite march.htm auf meiner Domain.

Hast du eine Ahnung wie es zu einem solchen Ausreisser kommt? Datenbankprobleme? Willkür?
 
QUOTE Hast du eine Ahnung wie es zu einem solchen Ausreisser kommt? Datenbankprobleme? Willkür?
Der Spider von Inktomie hat wie jedes andere Programm zu irgendeinem Zeitpunkt Bugs.

Wie gesagt, wenns ein Einzelfall in deinen Logs ist, vergiss es einfach.


QUOTE Ich weiss von keiner Seite, die so verlinkt. Es gab auch noch nie eine Seite march.htm auf meiner Domain.
Dann klick mal: http://www.hoerler.net/march.htm

;-)
 
Sicher auch dort sind ja nur Menschen
cool.gif


Jup, das ist so, man gelangt, wenn man eine falsche Datei angibt auf die Startseite. Ist extra so. Aber funktioniert nur wenn nur ein Slash nach dem Domainnamen folgt.

Würdes Du mir von dem abraten?
 
Das ist Ansichtssache, wir machen das oft auch so, aber ich wär dagegen ;-)
M.E. solltest du einen 404 anzeigen, dh header schicken und auf march.htm weiterleiten.

Aber die Glocke hat geläutet. /einzelansicht,parties,cill_riverside03,DSC00469.JPG,2[.html] gibts nicht auf deinem Server also scheint doch irgend ein Fehler deinerseits vorhanden zu sein, irgendwo stammt der Teil der Url schon her. Mit deinem include anstatt redirect verwirrst du Inktomi vielleicht ;-)

Schreib doch das in deine .htaccess
QUOTE ErrorDocument 404 http://www.hoerler.net/march.htm
 
Hab das versucht in meine .htaccess zu schreiben, funktioniert aber nicht so richtig.

Aber grundsätzlich sollte ich doch den 404 anzeigen, statt zu includen, was ich dann aber eh nicht mer in der .htaccess sondern im Script löse.

Es ist möglich, dass es diese URL mal gegeben hat, oder vielleicht immernoch gibt, aber nach meinen Tests gerade habe ich keine "falschen" Links dieser Art gefunden.
 
QUOTE Aber grundsätzlich sollte ich doch den 404 anzeigen, statt zu includen, was ich dann aber eh nicht mer in der .htaccess sondern im Script löse.
Genau. Du kannst also auch einfach den Header selber senden.

Ganz edel sind sinnvolle 404 Seiten, welche Fehler abfangen. Aber m.E. nicht wirklich nötig ;-)
 
Ich bins nochmals, bin nämlich nicht sicher ob ich das jetzt richtig begriffen habe. Bei einem normalen Zugriff sieht das jetzt so aus:

- - [22/Oct/2004:09:52:58 +0200] "GET /test_php5/ HTTP/1.1" 200 6494 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; .NET CLR 1.1.4322)"
- - [22/Oct/2004:09:52:58 +0200] "GET /test_php5/images/hoerlernet.gif HTTP/1.1" 304 - "http://www.hoerler.net/test_php5/" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; .NET CLR 1.1.4322)"
- - [22/Oct/2004:09:52:58 +0200] "GET /test_php5/hoerler.css HTTP/1.1" 304 - "http://www.hoerler.net/test_php5/" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; .NET CLR 1.1.4322)"
- - [22/Oct/2004:09:52:58 +0200] "GET /test_php5/images/top.gif HTTP/1.1" 304 - "http://www.hoerler.net/test_php5/" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; .NET CLR 1.1.4322)"

Wenn jetzt http://www.hoerler.net/march.html aufgerufen wird, sende ich zuerst den 404 header leite, dann aber auf die Standardseite (=Einstiegsseite) weiter:

- - [22/Oct/2004:09:53:04 +0200] "GET /test_php5/march.html HTTP/1.1" 404 6494 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; .NET CLR 1.1.4322)"
- - [22/Oct/2004:09:53:04 +0200] "GET /test_php5/images/hoerlernet.gif HTTP/1.1" 304 - "http://www.hoerler.net/test_php5/march.html" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; .NET CLR 1.1.4322)"
- - [22/Oct/2004:09:53:04 +0200] "GET /test_php5/hoerler.css HTTP/1.1" 304 - "http://www.hoerler.net/test_php5/march.html" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; .NET CLR 1.1.4322)"
- - [22/Oct/2004:09:53:04 +0200] "GET /test_php5/images/top.gif HTTP/1.1" 304 - "http://www.hoerler.net/test_php5/march.html" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; .NET CLR 1.1.4322)"

Habe ich das jetzt richtig begriffen und auch richtig gelöst?

 
Ich hoffe ich wirke jetzt nicht allzu ungeduldig, doch kann mir jemand sagen, ob ich das richtig verstanden und gelöst habe, oder ob ich auf dem Holzweg bin? Ich bin dankbar um jede Hilfe!

Grüsse Oliver
 
Zurück
Oben