Descargar todos los errores de rastreo (con sus orígenes) de un sitio web mediante el API de Google Search Console

Para los técnicos, aquí tenéis el enlace hacia la documentación del API de Webmaster Tools. Para los menos técnicos, podemos jugar con ella mediante los plugins de Excel “Excel SEO Tools” y mejor todavía (ya que permite no solo descargar los errores 404 si no también los lis “Linked From” asociados, plugin “Analytics Edge“. Ambos de pago pero con trials de prueba.

Antes de nada, el límite de descarga son entre 1000 y 5000 errores diarios, pero podemos saltarnos esta limitación fácilmente agregando subdirectorios de nuestro sitio a Google Search Console ya que el límite realmente se aplica por sitio de webmaster tools y no por dominio, por lo que si tenemos sitio.com/noticias/ y sitio.com/fotos/ podremos descargar 1000 de cada sitio.

Antes de nada, recordad que tener muchos errores 404 detectados por Google no tiene por qué ser un gran problema SEO si los orígenes de esos errores no están en nuestro sitio web. Realmente el problema lo tendría el origen que está enlazando destinos rotos y eso a Google no le va a gustar un pelo. Más información sobre este tema aquí. No obstante, siempre conviene tener el informe limpito básicamente para poder detectar nuevos reales graves más fácilmente.

Descargar errores 404 y los linked from con Analytics Edge

Descargamos el plugin y instalamos también el connector.

Una vez instalado, abrimos Excel > Google Search > Site Admin> URL Crawl Errors Samples > Category (notFound) > platform (web) > finish

Asegúrate de comprobar la URL (dominio, subdominio con www, con http, https, etc que quieres extraer, sleccionalo con el ratón mejor que ponerlo a mano para evitar errores.

Te salen los 1000 primeros errores.

Para descargar los detalles de cada error, tendríamos que hacer lo mismo que antes, pero seleccionar esta vez “Crawl Errors Details” y darle la URL del error que queramos.

Si lo queremos automatizar pudiendo poner en ese campo en lugar de una URL “[pageUrl]” y poder arrastrar celdas hacia abjo, debemos comprar la licencia del CORE Addin.

Es decir, necesitaríamos comprar el Plugin Analytis Edge CORE (72€/año) y el Google Search Console Connector, (48€/año) en total 120€/año.

Si tienes el CORE PLUGIN y no te saca los 1000 primeros errores le damos arriba a “FILE” y cambiamos el de “reemplazar” y le decimos un “worksheet” nuevo y ahí nos pondrá los 1000 (recuerda que puedes relativizar a una celda.. y poner años a años en cada celda y te sacará todos”

Actualización 18 de Abril de 2016: Con las nuevas funcionalidades del API, ya no es necesario hacer nada más. Quizá incluso con el Analytics Edge Basic, puedas descargarte los errores, tengo que probarlo. Hasta ahora con el API viejo los pasos a seguir eran:

Luego haces otra consulta con [pageUrl]
y la vuelves a escribir en otra hoja diferente..

Niels Bosma, autor de excel seo tools, comentó hace unas semanas por twitter que implementarían esta funcionalidad también, de momento puedes descargar los errores pero no los orígenes. Incluso dijo que podrías ejecutar consultas directamente al API vía excel como si fuese una consola. ¡Quedamos a la espera!

Por otro lado, Mike Sullivan, autor del Analytics Edge Plugin, me comentó hace unos meses por email que había incluido en el roadmap el poder agregar y eliminar sitios a Google Search Console directamente desde Excel, muy útil tambíen cuando te enfrentas a sitios con millones de errores… para evitar todas las limitaciones de los 1000 errores / día. Pero lo mejor será cuando permita marcar como solucionados también vía excel de forma super fácil para los mortales

Finalmente, andamos a la espera también de gente que me consta que ha conseguido automatizar el mark as fixed, libere el código necesario para newbies. 🙂

CategoríasSEO

Deja un comentario