expresiones-regulares-regex-seo

Guía Regex para SEO

SiciliaDigital te muestra en esta guía, cómo usar Regex para SEO, incluso si no tienes conocimientos de programación.

Los RegEx son fáciles de aprender y asombrosamente útiles, así que asegúrate de pasar por todo este tutorial porque va a ser una de las mejores inversiones de tiempo vs resultados en tu carrera de SEO.

¿Qué son las expresiones regulares (Regex)?

Las Regex, o expresiones regulares, se utilizan para detectar patrones en las secuencias de caracteres de las cadenas.

Con las RegEx, puede hacer coincidir fácilmente muchos resultados que tengan el mismo patrón.

Expresiones regulares básicas

Caracteres REGEX para SEO

Por ejemplo, uno de los patrones más comunes que utilizamos con Google Analytics son estos:

.*site1.*|.*site2.*

o su equivalente

.*site(1|2).*

De este modo, podrémos hacer coincidir cualquiera de esos resultados:

#Match sitio1.com sitio1.es sitio2.net www.sitio2.com sitio2.com/url-path   #No Match www.google.com

RegEx no es específico de ningún lenguaje de programación.

Por lo tanto, tanto si utilizas Google Analytics como si programas en Python, JavaScript o Java, necesitarás en algún momento utilizar expresiones regulares.

Las expresiones regulares son diferentes de un lenguaje de programación a otro.

Sin embargo, si aprendes a utilizar expresiones regulares generales, no tendrás ningún problema en utilizarlas en cualquiera de los lenguajes de programación.

Cómo empezar a utilizar RegEx

Esta guía le guiará a través de los fundamentos de RegEx. Tienes que saber que no todas las RegEx son iguales. Las Expresiones Regulares (REGEX) son usadas en la programación y en el análisis de datos.

Dependiendo del lenguaje de programación que uses, o de la herramienta que utilices, algunas RegEx no funcionarán.

¿Por qué aprender RegEx para SEO?

Los SEOs comienzan a utilizar Regex sobre todo porque utilizan Google Analytics y el análisis de datos.

Posteriomente, empezaremos a utilizarlo para rastreo y scraping.

A medida que tu carrera y conocimientos progresen, empezarás a utilizarlo para hacer llamadas a la API, hasta que lo utilices en todas partes.

Para filtrar todo el tráfico orgánico procedente de Google, incluyendo la Búsqueda de Google y Google Jobs, pero excluyendo Google CPC.

En este caso, iríamos a Adquisición > Todo el tráfico > Fuente/Medio > Avanzado y utilizaríamos la expresión regular .google.organic.* para filtrar los resultados.

Y obtendrías un informe como este.

Sabemos que esto es básico, pero queríamos mostrar porqué necesitarás Regex un día u otro en tu carrera como SEO.

Las expresiones regulares en Google Analytics son bastante limitadas en comparación con lo que realmente se puede hacer con Regex.

Expresiones regulares básicas

Vamos a sumergirnos en los fundamentos de las expresiones regulares.

Coincidencia de caracteres

Para hacer coincidir uno o varios caracteres puede utilizar banderas como las que acabamos de ver. También puede utilizar comodines u otro conjunto de indicaciones específicas.

. coincide con cualquier cosa. SE. coincidirá con SEO y SEM;

[aeiou] coincide con una de esas vocales. b[aiu]g coincidirá con bag, big y bug. [aeiou]\g coincidiría con varias vocales;

[a-z] coincide con una serie de caracteres. Esto coincidiría con cualquier carácter minúscula del alfabeto. Para que coincida con cualquier carácter en minúscula y en mayúscula, puedes utilizar[a-z]\i o [a-zA-Z];

[0-9] coincide con un rango de números del 0 al 9. Puedes combinar los regEx para hacer coincidir números y letras de la siguiente manera [2-5b-h];

^ sólo coinciden si comienzan con la cadena. ^SEO.* coincide con SEO es genial, pero no me gusta el SEO.

$ sólo coincide si termina con la cadena. .*regex$ coincide Me encanta trabajar con regex, pero no coincide con regex es impresionante.

Colou?r dice que el carácter anterior «u» es opcional. Coincide con Color y Color.

Lógica O / Y

Si quieres incluir uno o más resultados o fusionar múltiples condiciones en sus expresiones regulares utiliza el OR lógico.

Utilizando el símbolo |, podrá hacer coincidir varias condiciones.

Cuando necesites que TODAS las condiciones sean verdaderas, puedes combinarlas usando una alternativa al operador AND utilizando el patrón .(?=.patrón)(?=.patrón).

Por ejemplo:

python | seo - Coincidencias: python OR seo. Coincidencias: Trabajos en Python, Trabajos en SEO, Python para SEO.
.*(?=.*python)(?=.*seo).* - Coincide: python AND seo. Coincide: Python para SEO, SEO con Python pero no coincide con trabajos de SEO.

La sintaxis AND no es compatible con Google Analytics.

Tendrás que hacerlo de esta manera:

Cuantificadores

Los cuantificadores, o especificadores de cantidad, son útiles para indicar el número de veces que se quiere repetir un carácter.

Esto representa el número de veces que puede coincidir lo anterior.

Juegos de caracteres negados

Cuando quieras crear un conjunto de caracteres que no quieras que coincidan, deberás utilizar conjuntos de caracteres negados.

Para crearlos, se puede utilizar el carácter carets dentro de un conjunto de caracteres ([^]).

[^] coincide con una cadena que no incluye. [^aieou] coincide con un solo carácter no presente en la lista [aeiou];

Previsión positiva y negativa

Los lookaheads son patrones que indican que hay que buscar en la cadena los patrones que se especifican. Hay lookahead positivo ((?=)) y lookahead negativo ((?!)) .

se(?=o) seo #match "se" sem #no match    se(?!o) seo #no match sem #match "se"

Comparación codiciosa y vaga

En las expresiones regulares, una coincidencia codiciosa encuentra la parte más larga posible de una cadena que satisface la expresión regular. Una coincidencia perezosa es lo contrario. Encuentra la parte más pequeña posible de la cadena que satisface la expresión regular.

.* es una coincidencia codiciosa ya que coincide con cualquier cosa. <.*> coincidirá con <h1>Esto es HTML</h1>. 
? es una coincidencia perezosa. <.*?> coincidirá con <h1>

Agrupar elementos de un RegEx

Puede agrupar los elementos de una RegEx con paréntesis () en un elemento llamado grupo de captura.

sam.*(hunt|jackson) coincidiría con sam hunt y samuel l. jackson, pero no con sammy davis jr.

Otras Regex útiles

(?<=[\/])\d{2,} Coincide con cualquier número de identificación precedido por una barra invertida.

^\s+|\s+$ Selecciona todos los espacios en blanco al principio y al final de una cadena. Esto puede ser útil al hacer la manipulación de datos.

(?<=.)(.*?)(?=.) Permite extraer un nombre de dominio. Esto coincidirá con cualquier cadena entre dos puntos.

(?<=cadena)(.*) Coincide con todo lo que sigue a una cadena, excluyendo esa cadena. Útil para limpiar URLs.

Banderas (no para GA o GSC)

Las banderas le ayudarán a determinar qué tipo de carácter debe coincidir. Es posible que desee ignorar las mayúsculas y minúsculas al realizar la coincidencia o que sólo coincida con palabras numeradas.

Para ello, tendrá que terminar su regex con una bandera como esta:

google\i

Coincide con Google y Google.

Las banderas más útiles son:

\i ignorar caso; \g coincide con más de una vez (JavaScript); \d coincide con un dígito del 0 al 9; \w coincide con una letra ASCII, un dígito o un guión bajo. Es lo mismo que [A-Za-z0-9_]\g; \s coincide con los espacios en blanco; \D coincide con cualquier cosa que no sea un dígito de 0 a 9; \W coincide con cualquier cosa que no sea una letra ASCII, un dígito o un guión bajo; \S coincide con cualquier cosa que no sea un espacio en blanco.

Prueba de las expresiones regulares

Aquí tienes tres sitios web para probar, guardar y compartir tus expresiones regulares.

https://regex101.com/

https://www.regextester.com/

https://regexr.com/

logo seo posicionamiento madrid

Esta guía tiene su origen en https://www.jcchouinard.com/regex-for-seo/ y ha sido traducida al castellano por Sicilia Digital.

En Sicilia Digital, cuando vemos una iniciativa que sea solidaria y que tenga algo que ver con los proyectos que realizamos para algunos clientes, nos gusta hablar de nuevos planteamientos para ayudar a los menos afortunados.

Queríamos hablaros sobre el SEO para tiendas de ropa, pero iremos ampliando este post con algo que nos llamó la atención mientras buscábamos enlaces para tiendas.

Vimos que podíamos aportar un poquito a negocios menos afortunados con el marketing y posteamos esto.

Vamos a comenzar en este post por hacer un mini homenaje a empresas y tiendas de ropa que aunque no hagan SEO, sí que podemos llevarnos de ellos grandes aportaciones a la sociedad.

Collague de negocios de ropa

Os dejamos con algunos enlaces que os recomendamos acceder para conocer sus programas para personas desfavorecidas y de inclusión.

Destacamos:

Vericia una marca Española: https://www.grupoamas.org/vericia-la-firma-de-moda-espanola-con-mucho-corazon/

Add a Comment

Your email address will not be published. Required fields are marked*

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.