Extrem viele nicht indexierte Seiten und Crawling-Anomalien in der Search Console

Marc R.

Neues Mitglied
Hallo zusammen,

ich bin gerade dabei, meine Website für Suchmaschinen zu optimieren und bin bei der Google Search Console auf einen Punkt gestoßen, der mich etwas verwirrt und unsicher gemacht hat. Für eure Hilfe wäre ich sehr dankbar.

Als Hintergrundinformation: Die Seite (marcrodenberg.de) ist meine berufliche Website als Hochzeitsfotograf. Ich benutze seit ca. 1,5 Jahren wordpress.org, gehostet bei Strato. Vorher hatte ich meine Website bei wordpress.com und hatte mir die url marcrodenberg.de „dazugekauft“. Vor 1,5 Jahren habe ich mir dann über wordpress.org eine komplett neue Seite aufgebaut und diese mit der url marcrodenberg.de (die ich zu Strato habe übertragen lassen) verbunden.

Wie auf dem angehängten Bild zu sehen, hat Google 37 Seiten indexiert und 2785 ausgeschlossen, wovon 1363 gecrawlt worden, aber nicht indexiert wurden und 1342 eine Crawling-Anomalie aufweisen. Zunächst hat mich die unglaubliche hohe Zahl an ausgeschlossen Seiten sehr verunsichert. Jetzt hatte ich bezüglich der gecrawlten, aber nicht indexierten Seiten die Idee, dass Google vielleicht jedes Foto als einzelne Seite (Attachment) ansieht? Oder habt ihr eine andere Erklärung für diese hohe Zahl? Ist das SEO-relevant?

1-Search-Console-Indexierte-Seiten.jpg


Als ich mir die urls mit einer Crawling-Anomalie näher angeschaut habe, habe ich feststellt, dass es ich hierbei um urls von meiner „alten“ wordpress.com-Website handelt, die logischerweise alle zu einem 404 führen. Die alte Website existiert auch noch, nur eben nicht mehr unter meiner Haupt-url (marcrodenberg.de). Die Frage ist jetzt, ob das SEO-relevant ist, und wenn ja, wie ich jetzt am besten vorgehe. Ist es sinnvoll, die alte Website einfach komplett zu löschen oder macht das den Schlamassel nur noch größer? Was ist die Alternative?

Gruß, Marc

 
Hallo Marc,

wenn die alte Website gleichen Inhalt bietet, solltest du sie abschalten, weil du dir selbst damit Konkurrenz machst und im schlimmsten Fall sogar Duplicate Content produzierst.

Sinnvoll wäre, die alte Seite auf die neue umzuleiten, falls sie irgendwann mal unter einer anderen Domain erreichbar gewesen ist. Wenn du schon immer die gekaufte Domain nutzt und die alte darunter auch erreichbar war, ist es aber egal, dann kannst du sie archivieren.

Die 404er legen sich mit der Zeit, solange du nicht auf fehlende Seiten verlinkst. Möglicherweise führen von der alten Homepage noch Links zu Inhalten, die unter der Adresse jetzt nicht mehr erreichbar sind, und damit ins Leere. Vermutlich legt sich schon viel, wenn du die alte Version abschaltest.

Jetzt hatte ich bezüglich der gecrawlten, aber nicht indexierten Seiten die Idee, dass Google vielleicht jedes Foto als einzelne Seite (Attachment) ansieht?
Wenn sie über eine eigene URL aufrufbar sind, ja. Ist gerade bei Wordpress sehr häufig der Fall.

 
meine Website für Suchmaschinen zu optimieren und bin bei der Google Search Console auf einen Punkt gestoßen, der mich etwas verwirrt und unsicher gemacht hat.
Nun eigentlich hat man die Positionierung schon vor Veröffentlichung machen sollen. Was du unter Abdeckung da siehst solltest du über site:deine-webseite.de überprüfen. Remove URL scheint über die GSC nicht mehr zu funktionieren (Stand Gestern (11/02/2020) Allerdings wenn die die alten URL mittels 301 Redirect auf die neuen schickst ist es gut möglich das Google dir die alten URLS ruckzuck aus dem Cache löscht. (passiert Gestern (11/02/2020)

Mit WP und hohen Seitenzahlen hat Yoast eventuell viel zu viel in den Index gedrückt? 

 
Zuletzt bearbeitet von einem Moderator:
Mit WP und hohen Seitenzahlen hat Yoast eventuell viel zu viel in den Index gedrückt? 
Nicht einmal annähernd 100 Seiten.

Allerdings wenn die die alten URL mittels 301 Redirect auf die neuen schickst ist es gut möglich das Google dir die alten URLS ruckzuck aus dem Cache löscht. (passiert Gestern (11/02/2020)
Geht das bei wordpress.com? Automatisch nicht, oder? Ich arbeite damit nie.

 
Geht das bei wordpress.com?
je nach Fall leite ich über htaccess weiter, der besagte Fall war webnode. Laut Abdeckung GSC sind es 9 Seiten im Index sind aber gute 25 von 28. In den Google Supportforen wird einem geraten die Aussagen der GSC zu ignorieren.  

 
Auf mich wirkt die Seite ausgesprochen ansprechend - tolle Fotos, gute Texte, stimmiger Auftritt. Die Seite war für mich Mobil nicht, per Desktop aber erreichbar.

Ich habe es nicht gesehen: Ist Deine Telefonnummer so verlinkt dass man mit einem Mobilgerät aus der Seite heraus (ohne fehlerbehafteten Abschreib- und Eintippaufwand) direkt bei Dir anrufen kann? Wenn nein, würde ich das noch machen.

 
War auch Unsinn, was ich schrieb, die neue Version läuft ja unter der gleichen Domain, d.h. wenn er nun selbst ein WP-Blog hostet, könnte man das per .htaccess umleiten.

 
Vielen Dank für eure Hinweise und euer Feedback!

Bevor ich mir jetzt die Mühe mache und irgendetwas mit meiner alten Website (die noch auf wordpress.com dahinvegetiert) anstelle: Wisst ihr, ob diese Crawling-Anomalien SEO-(also Ranking-)relevant sind? Fehler werden ja in der GSC nicht angezeigt.

Ansonsten habe ich meiner Ansicht nach folgende Optionen:

1. Die alte Website komplett löschen. (Ich brauche sich ja nicht mehr. Aber irgendwie habe ich (eine wahrscheinliche irrationale) Angst davor, hiermit das Schlamassel noch größer zu machen.)

2. Bei meiner alten Website auf dem Dashboard unter "Einstellungen" --> "Lesen" --> "Sichtbarkeit des Blogs" folgendes einstellen: "Suchmaschinen daran hindern, diese Website zu indexieren (Hinweis: Keine dieser Einstellungen verhindert den Zugang zu deiner Website — Es obliegt den Suchmaschinen, deine Anforderung zu berücksichtigen.)"

3. Bei meiner alten Website auf dem Dashboard unter "Einstellungen" --> "Lesen" --> "Sichtbarkeit des Blogs" folgendes einstellen: " Meine Website soll nicht öffentlich und damit nur für mich und Benutzer sichtbar sein, die ich auswähle."

Was wäre wahrscheinlich die beste Option? Einfach löschen oder 2. oder 3.?

PS: @Johannes T  Danke für das Kompliment! Ich habe mir Mühe gegeben. Und danke für den Hinweis, dass die Seite bei dir nicht über das Handy erreichbar ist. Auf meinem (Android-)Handy funktioniert es. Aber dann muss ich da noch mal recherchieren. Die Handynummer sollte direkt anrufbar sein.

 
Was wäre wahrscheinlich die beste Option? Einfach löschen
Ich würde sie löschen. Eventuell findest du bei der GSC noch die Möglichkeit das Domain umzutragen von der alten auf die neue Seite. 

Die GSC ist z.Zt nicht der Hit zeigt oft mal Sachen an die nicht stimmen wenn man es dann mit den SERP abgleicht. 

 
Zurück
Oben