Canonical tag: conoce lo que hay detrás de las URL canónicas
Cuando varias URL presentan el mismo contenido o contenido muy similar, se considera que existe contenido duplicado. Esta situación puede impactar negativamente en la indexación de las URL implicadas. Para aquellos proyectos que ofrecen contenidos muy parecidos, gestionar el contenido duplicado supone un desafío. Una posible solución para este problema es la llamada canonical tag, con la que se puede declarar una dirección URL o URI como versión principal del contenido para la indexación.
¿Qué es una canonical tag?
En 2009, Yahoo, Microsoft y Google introdujeron la etiqueta canónica o canonical tag para enlaces, la cual se convertiría en una de las herramientas para el SEO más importantes. Desde 2012, es considerada un estándar web oficial según la norma RFC 6596. Cuando se integra un enlace canónico en una página web, el enlace apunta a una dirección URL o URI que funciona como URL canónica, la cual reemplaza a la página web como referencia para la indexación.
Una URL canónica aúna su propia reputación y la de las páginas a las que enlaza, lo que le permite obtener un mejor posicionamiento en los motores de búsqueda. Además, como las direcciones enlazadas no se incorporan al índice de indexación, no surgen problemas de contenido duplicado. No obstante, esta indicación actúa solo como recomendación para los motores de búsquedas, que no tienen por qué registrar el atributo “link” ni incluirlo en la valoración. Si no se implementa correctamente, existe el riesgo de que la página sea ignorada por completo, por lo que es crucial prestar atención al utilizarla.
¿Cómo funciona una canonical tag?
Para que la etiqueta canónica funcione correctamente, se requieren dos elementos esenciales. Por un lado, es necesaria la URL exacta de la página canónica deseada, la cual se considera la versión principal del contenido. Por otro lado, se necesita un elemento “link” en el que se incluya la etiqueta y la URL canónica. El código que se muestra es un ejemplo para una canonical tag:
<link rel="canonical" href="URL/URI de la página canónica ">
htmlEl elemento “link”, que en HTML no tiene una etiqueta de cierre, contiene solo los atributos rel y href. El primero es necesario para especificar la relación entre el documento actual y el enlazado, mientras que href indica dónde se encuentra el documento enlazado. Los valores requeridos a tales efectos aparecen entrecomillados: el valor rel “canonical” determina que el enlace es una dirección URL canónica, la cual se indica a continuación en el atributo href.
Para que las páginas alternativas solo hagan referencia a la versión principal especificada, el código debe integrarse en la cabecera de los documentos HTML correspondientes. Pero, incluso si el contenido no está disponible en HTML, como, por ejemplo, en el caso de archivos PDF, también es posible implementar una etiqueta canónica en la cabecera HTTP. En este caso se utiliza la siguiente sintaxis:
Link: <URL/URI de la página canónica>; rel="canonical"
html¿Cuándo se deben usar las canonical tags?
Por definición, las etiquetas canónicas no son un factor que los motores de búsqueda tengan necesariamente en cuenta. Dado que el código debe ser implementado individualmente para cada contenido duplicado y URI alternativa, se plantea la pregunta de si el esfuerzo de gestión asociado, relativamente elevado, resulta rentable. A continuación, te mostramos ejemplos de situaciones en las que conviene considerar la utilización de este tipo de etiquetas.
El contenido se reparte en varias direcciones URL dinámicas
Las URL dinámicas desempeñan hoy en día un papel muy importante, sobre todo en el ámbito del comercio electrónico. Las páginas personalizadas constituyen ciertamente una opción excelente y sencilla para presentar el mismo contenido (con ligeras variaciones) a usuarios diferentes, pero también causan problemas a los crawlers de los motores de búsqueda. Las canonical tags son, en este sentido, más que recomendables para evitar la posible clasificación de contenido duplicado.
Se puede acceder al mismo contenido con diferentes URL
En lo que respecta a la estructura, algunos proyectos web, como blogs, tiendas virtuales o guías digitales, ofrecen contenidos distribuidos simultáneamente en diferentes categorías y a menudo también en diferentes URL. Así, una tienda podría redirigir, por ejemplo, a la página general del artículo “camisa verde” bajo las siguientes direcciones URL:
-
mi-tienda.shop/moda/camisa-verde
-
mi-tienda.shop/modadeverano/camisa-verde
-
mi-tienda.shop/modadeinvierno/camisa-verde
El hecho de que los contenidos estén disponibles bajo diferentes URL es frecuente cuando se han modificado las estructuras de una página web o se ha trasladado un dominio completo. En estos casos, las redirecciones 301 son una buena opción, pero si no se puede llevar a cabo técnicamente, entonces el elemento link rel=“canonical” se erige como una buena alternativa.
El mismo contenido está disponible en dominios diferentes
La etiqueta canónica también se puede usar con dominios externos. El procedimiento es el mismo que en los dominios internos, por lo que también se debe proporcionar una URL exacta como versión principal. De este modo, puedes ofrecer tu contenido en otro dominio sin generar contenido duplicado. Con este método, también se traspasan los factores relevantes para el SEO a la URL principal, lo que puede mejorar significativamente su rendimiento.
Los contenidos tienen formatos diferentes
En algunas situaciones, resulta significativo publicar contenido en diferentes formatos y no ofrecer solo, por ejemplo, un formulario en versión HTML, sino también como archivo PDF y en versión para imprimir. En este sentido se recomienda usar la etiqueta canonical para que los motores de búsqueda no tengan que evaluar cada una de las variantes por separado y terminen clasificando la equivocada.
Si se dispone de un certificado SSL/TLS válido, es recomendable convertir las direcciones URL con HTTPS en canónicas y redireccionar las variantes no seguras (HTTP) a estas. Lo mismo se aplica a las páginas móviles o AMP, en cuyo caso las canonical tags son incluso obligatorias.
Canonical tag: errores comunes
Una URL canónica es en muchas situaciones la mejor opción para evitar el contenido duplicado. Los motores de búsqueda más importantes tienen en cuenta el elemento canonical en la indexación y reconocen que la web no tiene intención de posicionarse de manera paralela con contenido repetido. Además, las señales positivas de los buscadores se reúnen en la URL principal, lo que mejora las opciones de posicionamiento. En este punto, no obstante, ha de hacerse hincapié en la posibilidad de que el empleo de canonical tags pueda convertirse en un factor negativo si estas no se aplican correctamente. En los párrafos siguientes te mostramos los errores “canónicos” más comunes.
Con la herramienta de análisis SEO de IONOS, puedes comprobar sin coste y con gran facilidad el rendimiento de tu página web.
Las páginas numeradas remiten a una URL canónica
Para elaborar contenido atractivo, muchos webmasters recurren a la paginación. Son sobre todo los portales de noticias los que utilizan este método, en el que el contenido se numera y divide en varias páginas. Si para ello se emplean las etiquetas canónicas y se hace referencia a páginas posteriores que remitan a la dirección de salida con el link-rel="canonical"
, se está incurriendo en un error grave, porque las siguientes páginas no serían un duplicado, sino que albergarían contenido único que no se registraría en el índice. Para informar a los buscadores sobre la paginación escogida, puedes optar por dos procedimientos:
- En cada URL se hace referencia tanto a la página anterior como a la posterior, para lo que es necesario el atributo
rel
y para lo que también hay que reemplazar el valor"canonical"
por"prev"
o"next"
. - Con
link-rel="canonical"
se remite a una versión unilateral del contenido correspondiente que aúna todas las webs paginadas.
Las direcciones URL relativas no enlazan a la página canónica deseada
Como la mayoría de etiquetas de HTML, <link>
ofrece la posibilidad de indicar direcciones URL absolutas y relativas. Mientras que las absolutas describen toda la ruta (incluido “https://”, etc.), las relativas aluden específicamente a una carpeta determinada en la página web actual sin que para ello sea necesario indicar la dirección URL completa. Así, la ruta “imágenes/imagen.jpg”
indica, por ejemplo, que la imagen “imagen.jpg”
está ubicada en la subcarpeta “imágenes”
del directorio actual. La utilización de tales rutas al hacer uso de la etiqueta canonical tag da lugar a complicaciones, de modo que, en el peor de los casos, los crawlers la ignoran completamente.
Para ejemplificar lo arriba expuesto, se utiliza el siguiente ejemplo como guía:
< link rel="canonical" href="example.com/cupcake.html" >
htmlDebido a la ausencia del prefijo HTTP, el crawler valora la dirección example.com/cupcake.html
como URL relativa y asume que http://example.com/example.com/cupcake.html
es la URL canónica. Para evitar suposiciones, es conveniente indicar la URL canónica completa o recurrir a una URL absoluta sin dominio:
< link rel="canonical" href="/cupcake.html" />
htmlAplicar de forma incorrecta una estrategia SEO puede tener graves consecuencias en la clasificación de una página web en buscadores. Descubre los errores SEO más comunes para que no caigas en ellos.
Las páginas hacen referencia a más de una URL canónica
La naturaleza misma de las URL canónicas descarta que una página secundaria pueda hacer referencia a varias páginas consideradas como versiones principales. No obstante, este tipo de enlaces múltiples pueden aparecer fácilmente al trabajar con un sistema de gestión de contenidos o con un software para tiendas. A menudo, los plugins y las plantillas colocan canonical tags de manera automática, a pesar de haber indicado la presencia de una canonical URL. Sobre todo, al utilizar este tipo de plugins, pero también en el caso de los cambios en la estructura de las páginas, se debe verificar el texto fuente y corregir los datos si fuera necesario. De lo contrario, todo esfuerzo será en vano, ya que lo más probable es que los motores de búsqueda ignoren todos las canonical tags en lugar de decidirse por una.
Las canonical tags no aparecen en la versión móvil
Cuando, además de la versión de escritorio, se ofrece una versión móvil de una página web, puede que se tenga que hacer frente a varios errores. Asimismo, aun cuando las páginas móviles se indexan a pesar de la existencia de errores, se debe asistir a los motores de búsqueda en lo que respecta al registro y la categorización. Así, Google recomienda destacar los homólogos móviles como versión alternativa mediante el elemento rel=“alternate” y que las páginas móviles remitan por canonical tag a las correspondientes URL de escritorio. En la página web de Google Developers puedes encontrar más consejos e información en una guía para páginas web móviles.
Dentro del SEO hay muchos aspectos que tener en cuenta: componentes de una página web, estrategias de optimización, términos técnicos, etc. Por eso, quienes acaban de empezar con el posicionamiento en buscadores, pueden encontrar complicado entender el concepto. En nuestro artículo “SEO de la A a la Z” te enseñamos los términos relacionados más importantes
Contradicciones entre las canonical tags y el hreflang
Los proyectos web internacionales con diferentes dominios geográficos plantean un gran reto a los especialistas en SEO. Por un lado, las páginas de todos los dominios deben lograr un buen posicionamiento y llegar a los usuarios correctos. Por otro, hay que reducir el riesgo del contenido duplicado al mínimo. Una de la herramientas más importantes a este respecto es el atributo hreflang, pues sirve de ayuda para que las páginas individuales de cada dominio sean consideradas como alternativas equivalentes. Pero, para que el atributo funcione, es importante que cada página enlace a sí misma y a las otras versiones. Si estas URL también remiten a una canonical URL por medio de una canonical tag, los crawlers de los motores de búsqueda se encuentran ante una contradicción. El resultado es que los motores de búsqueda ignoran dichas señales e indexan las páginas web en función de otras características, por lo que se debe evitar, así, el uso conjunto de ambas instrucciones.
La combinación de URL canónicas y del atributo hreflang no es el único factor que genera contradicciones negativas para el ranking de las páginas web, sino que Google también rechaza el uso compartido de canonical tags y de instrucciones como nofollow, noindex o disallow.
Diferencias entre canonical tag y redireccionamiento 301
La etiqueta canónica y las redirecciones 301 tienen similitudes en su función de indicar a los motores de búsqueda que consideren varias páginas como una sola versión. No obstante, mientras los redireccionamientos 301, basados en el código de estado 301 de HTTP (Moved Permanently), dirigen a los motores de búsqueda y a los visitantes hacia una URL principal y suprimen el resto de variantes; las páginas que contienen la etiqueta canónica son vistas como copias por los motores de búsqueda, pero permanecen disponibles para los visitantes.
Otra de las diferencias estriba en el hecho de que los motores de búsqueda nunca ignoran un redireccionamiento, lo que sí puede ocurrir con el elemento “link” recomendado. Ambos métodos se diferencian, por último, en cuanto a su funcionalidad con respecto al uso de los dominios: mientras que los redireccionamientos 301 trasladan un contenido de un dominio a otro, la etiqueta canónica señala que una página del dominio A tiene un equivalente en el dominio B.