Die Frage sollte lauten: wie kann ich unnützen Referrer-Spam von realen Besuchern unterscheiden, die zu mir geschickt wurden.
Gehe ich richtig in der Annahme, dass Du bis jetzt lediglich Server-Statistiken studierst? Aber im Prinzip solltest Du nachverfolgen können, was die "Besucher" bei Dir auf der Seite tun: mehr als eine Seite anschauen?
Zudem: wenn Du eine JS-basierte Statistik-Lösung einsetzen würdest - wie Google Analytics - würdest Du relativ schnell sehen, wer richtige Nutzer schickt. Die ganzen "Bots" und "Spider" werden dann mehrheitlich schon rausgefiltert.
Google Analytics listet bei mir gar keinen Referrer-Spam auf... Daher deutet die Differenz zwischen Google Analytics und Serverstatistiken relativ rasch auf die Spammer und Unnützen Seiten hin.
Ausserdem:
es gibt "Referrer-Spam", es gibt aber auch noch "Hotlinking", das bei Dir Spuren in der Server-Statistik hinterlassen kann... Daher spreche ich nicht per se gegen Server-Statistiken, sondern weise darauf hin, dass Server-Statisken und auch JS-basierte Lösungen ihre Daseinsberechtigung haben.
Du kannst sowohl Referrer-Spam als auch Hotlinking mittels htaccess unterbinden. Ich bin soweit:
Referrer-Spam ignoriere ich. Aber Hotlinking unterbinde ich. Ich nutze meine Server-Stats übrigens nur noch, um Hotlinker herauszusuchen und dann dort zu prüfen, ob sie "Fair" sind, also noch einen Link setzen, oder ob ich denen eine etwas adaptierte Graphik ausliefern soll...