Extraer la URL del primer resultado de Google

En mi trayectoria profesional me he encontrado más de una vez con migraciones web con cambios de plataformas o arquitecturas que implican cambio de URLs y donde no se han redirigido las URLs antiguas a las nuevas. Muchas veces no se hace por desconocimiento del impacto SEO que esto tiene y no contar desde el inicio con un profesional SEO que te acompañe desde las fases iniciales del proyecto, en este caso la migración.

Casi seguro que no te libres de tener que hacer la relación de algunas portadas, portadillas o URLs de secciones principales totalmente a mano, correspondencia A > B para pintar los redirects 301. Sin embargo, cuando estamos hablando de webs relativamente grandes, resulta humanamente imposible pintar la correspondencia A > B de todos los detalles como noticias, fichas, fotos, etc de forma manual. En estos casos lo conveniente es que durante el proceso de exportación / importación, se genere y se guarde también la información de la correspondencia URL Antigua > URL Nueva.

Sin embargo, como hemos comentado anteriormente, no siempre esto se hace. ¿Qué hacer en estos casos? ¿Qué hacer si la web ya se ha lanzado, nos hemos dado cuenta de la caída SEO debido a la ausencia de redirecciones y ahora IT dice que es muy complicado generar esa tabla de correspondencias o redirecciones A > B?

El truco que voy a explicar a continuación, sirve para arquitecturas de URLs “viejas” que tuviesen las keywords en la URL. En caso contrario tendríamos que extraer títulos o contenidos de la cache de Google o de los sistemas de analítica web y la cosa se complica un poco más, quizá para otro post.

Lo que vamos a ver tiene como objetivo emparejar el listado de “TOP URLS DETALLE” que podemos descargar de nuestra herramienta de analítica web, de Google Search Console o de cualquier otra fuente, con la Nueva URL, siempre y cuando Google ya haya rastreado el nuevo sitio por completo (o en su mayoría) siempre podremos hacer búsquedas a mano o en el propio buscador interno de la nueva plataforma para completar allá donde Google no haya llegado todavía.

Mi buen amigo Antonio Parra ha preparado este Google Spreadsheet, donde mediante XPATH e IMPORTXML, extramos la primera URL que Google devuelve para una determinada Query, en nuestro caso la query sería la keywords de todas las URLs viejas que queremos redireccionar, en mi caso haría un MIX entre TOP URLs posicionadas y TOP URLs que están dando un error tras la migración.

Si a la query le agregamos “site:nuestrodominio.com” incluso “inurl:algo_que_diferencie_urls_viejas_nuevas” obtendremos (si ya ha indexado todo el nuevo sitio) las URLs a las que tendremos que redirigir las del origen.

Las 2 funciones de la hoja de cálculo son:

  • =CONCATENATE(“http://www.google.es/search?hl=es&source=hp&biw=&bih=&q=”;A2)
  • =REGEXEXTRACT(IMPORTXML(B2;”(//*[@class=’r’]/a[1][email protected])[1]”);”q=(.*)&sa”)

Para buscar en nuestro sitio y con algún parámetro en la URL la query del CONCATENATE debería ser:

  • =CONCATENATE(“http://www.google.es/search?hl=es&source=hp&biw=&bih=&q=site%3Adominio.tld%20inurl%3Ahtml5”;A2)

Actgualización, con Excel SEO Tools. Gracias a Estela Franco!

=XPathOnUrl(“http://www.google.es/search?q=wikipedia”;”//h3[@class=’r’]/a”;”href”)

Y si necesitas sacar el top 10, por ejemplo, haces matriz seleccionando rango, Ctrl+Shift+Intro y apañado.

Tarda, pero lo saca. 🙂

CategoríasSEO

Deja un comentario