Expresiones regulares

Regex para SEO

Las Expresiones Regulares, comúnmente conocidas como “Regex” son al SEO como el Excel es a la Analítica Web.

Ejemplos Regex o Expresiones regulares

Ejemplos Regex o Expresiones regulares

Dominarlas te permitirá entre otras cosas pelearte sin miedo con .htaccess así como sacar el máximo partido a herramientas como DeepCrawl, Screaming SEO Frog o Botify, entre otras muchas. Podrás usarlas también en Google Spreadsheet y en ciertas funcionalidades de Excel como buscar y reemplazar. Respecto a esto último de Excel, tengo que comprobar si en Office 2016 puedes usarlas en los filtros, tal y como permiten Libre Office u Open Office. En definitiva, creo que conocer las expresiones regulares es algo importante para cualquier perfil SEO, ya sea técnico o analista. Para entender su funcionamiento no es necesario saber programar para controlarlas, ni mucho menos, pero si tener cierta base sobre como funcionan los algoritmos o conjuntos de instrucciones. Seguro que si te pones con ello no te costará mucho 🙂

Algunos enlaces interesantes que te ayudarán:

Manual de Regex en Español: http://www.desarrolloweb.com/
Generador de Expresiones Regulares: https://regex101.com/
Comprobador de expresiones Regulares: http://www.metriplica.com/

regex en el .htaccess

No debemos olvidar que cualquier sentencia en el .htaccess o httpd.conf afectará a nuestro WPO. Para ello tendremos que tratar de usar las expresiones lo más livianas posibles, por ejemplo se suele usar erróneamente (.*) cuando se podría hacer simplemente con ([a-zA-Z0-9_-]+). A menos comprobaciones, menos carga. Una tilde en una URL puede ser perfectamente [aáâàä].

Por otro lado, en el caso de webs extremadamente grandes, a veces puede resultar mejor cargar las redirecciones en ficheros php en lugar de directamente en el .htaccess. Esto hace que su ejecución sea más lenta, pero por contra la carga de las máquinas lo agradece. Pero eso ya si que es cuestión de los programadores 🙂

Expresiones regulares útiles:

Termina con, por ejemplo .html: ^/(.).html$

Expresiones regulares en los filtros de Spreadsheet | Excel | Open Office | Libre Office

Cuando estoy haciendo una auditoria me gusta saber cuántas URLs hay de cada tipología posicionadas, cuánto tráfico tiene cada una, etc. Para ir quitando “elementos” lo que hacia hasta ahora era filtrar en Excel las URLs posicionadas, que no contengan “noticias”, copiar & pegar, aplicar otro filtro, tampoco fotos, tampoco videos. Así hasta que más o menos tenía una idea de todas las tipologías de contenidos o temáticas (basado en URLs) que podía tener una web, un proceso bastante manual vamos.

Si quieres ir más deprisa, puedes hacerlo con expresiones regulares en Open Office, no he conseguido hacerlo en Excel ni Google Drive. En un filtro, podemos concatenar cuantas condiciones queramos (realmente no se si habrá límite, pero yo no he llegado tan lejos). Por ejemplo podemos darle a “Datos > Filtro > Estándar”, ¡recuerda activar “REGEX” en opciones avanzadas!

En nombre de campo tenemos que poner la columna que contiene las keywords que queremos filtrar y en condición y hay que poner “contiene” o “no contiene..” de luego para que no contenga ninguna keyword podemos poner en condición simplemente, sin las comillas “(keyword1)|(keyword2)|otra_key”, etc.. También podemos usar comodines, etc. Por ejemplo:

(noticias)|(news)|(nachrichten)|(nouvelles)|(notizie)|(photos)|(fotos)|(videos)|(video)

(noticias)|(news)|(nachrichten)|(nouvelles)|(notizie)|(photos)|(fotos)|(videos)|(video)

Para Google Analytics, también podemos incluir este segmento a la hora de agrupar URLs con regex

(^/$)|(^/es$)|(^/es/$)|(^/en$)|(^/en/$)|(^/it$)|(^it/$)|(^/fr$)|(^/fr/$)|(^/ja$)|(^/ja/$)|(^/pt$)|(^/pt/$)

 

About the author

Javier Lorente Murillo

https://plus.google.com/+JavierLorente/posts

2 comments

Leave a comment:


A %d blogueros les gusta esto: