Aunque su uso es generalizado y recurrente, siguen siendo las grandes desconocidas. No son explotadas tanto como cabría esperar. Las expresiones regulares (RegExp) son un estándar que cualquiera que trabaje dentro del ámbito digital debería conocer. Por ello pueden ser empleadas de igual manera en innumerables aplicaciones y herramientas. Un buen ejemplo podrían ser los productos de Google: Google Analytics (GA), GTM, Data Studio, Optimize, …

Intentemos por un momento dar respuesta a preguntas como: ¿de qué forma puedo analizar en GA sólo aquellos slugs que contengan la keyword “camiseta-blanca” o “camiseta-negra”?, ¿cómo puedo en GTM activar una etiqueta para todas las urls que finalicen con un SKU (Stock-Keeping Unit o código de artículo) de producto?, ¿podría redireccionar varios posts indexados en Google y etiquetados bajo una categoría que ya no existe a una nueva ubicación?, etc. Todas las respuestas tienen algo en común, sería necesario o recomendable el manejo de regex.

Aunque no son muchas, sus combinaciones son infinitas y a veces indescifrables incluso para el ojo más experimentado. Su comprensión y configuración óptima requiere de muchas horas de prueba-error.

Antes de realizar la práctica propuesta (ver más abajo los ejercicios), es necesario definir y especificar cada una de las principales expresiones regulares existentes …

Cheat sheet de expresiones regulares, tabla RegExp

Aprender a crear expresiones regulares

Las regexp son un conjunto de meta-caracteres con características especiales. Si son usados junto con otros caracteres normales pueden especificar determinados patrones de texto. Es decir, son capaces de señalar partes específicas de una cadena de texto. No son ni más ni menos. Así de sencillo. Lo mejor para poder entenderlas en profundidad es practicar con ellas.

Veamos a continuación varios ejercicios sencillos para realizar con la ayuda de la tabla anterior. Para ello, es recomendable utilizar alguna de las herramientas para testar expresiones regulares que tenemos a nuestra disposición.

Por ejemplo, una buena opción es regex101.com. Su configuración básica se basa en los campos regular expression y test string. En el primero se ha de añadir la expresión regular y en el segundo varias líneas de texto sobre las que se realizarán las pruebas oportunas (ver a continuación). Es importante también el selector Set Regex options, situado al final del primer campo. Este sirve para configurar el funcionamiento de la expresión regular y, por normal general, se deberán seleccionar las dos primeras opciones (global y multi line). 

Lo primero, para poder realizar los ejercicios, es añadir al campo test string de esta herramienta lo siguiente (línea por línea) …

http://ejemplo.com/
https://www.ejemplo.com/#contacto
https://ejemplo.com/futbol/club/camisetas/primera-equipacion-sku31.html
https://ejemplo.com/alpinismo/?utm_source=facebook&utm_medium=ads
https://ejemplo.com/alpinismo/material/piolet-sku2A3
https://ejemplo.com/blog/
https://ejemplo.com/blog/mejor-pagina-html-del-deporte
https://ejemplo.com/blog/un-ejemplo-para-el-deporte

Lo segundo, los requerimientos (enunciado de los 5 ejercicios propuestos) que deberemos solventar a través de las expresiones regulares …

    1. “Obtén todas las urls que comiencen con el protocolo seguro https”.
    2. “Detecta qué urls siguen conteniendo extensiones .html”.
    3. “Escoge sólo los productos cuyo SKU comience por dos números”.
    4. “Visualiza todos los artículos o posts del Blog sin incluir la página principal de este”.
    5. “Devuelve únicamente el dominio (sin protocolo) y el directorio de primer nivel”.

Y por último, las soluciones a los requerimientos previos. Para comprobar la implementación se debe añadir cada una de las siguientes regexp (haz click en el siguiente accordion) en el campo regular expression de la propia herramienta …

SOLUCIÓN
  1. ^https
  2. .html$
  3. sku[0-9]{2}
  4. \/blog\/.+
  5. ejemplo\.com\/((?!\/).)+\/

Con respecto a cómo interpretar tu nivel según los resultados obtenidos, por cada regexp 100% acertada súmate 1 punto, en cualquier otro caso 0. 

    • 5 puntos: “Tienes un control absoluto y seguro que usas regexp habitualmente”.
    • 4 puntos: “Tu nivel es muy bueno, sigue practicando”.
    • 3 puntos: “Quizás solo uses regexp para acciones esenciales”.
    • 2 puntos o menos: “Si tienes la oportunidad de utilizar regexp deberías aplicarte en su estudio”.

Estos ejemplos mostrados representan una pequeñísima parte del basto universo de posibilidades asociadas a las expresiones regulares. Aprovechar sus posibilidades es cuestión de práctica …

Si crees que no necesitas usarlas, quizás no estés aprovechando al máximo tu trabajo.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *