¿Qué es una URL no canónica en un Sitemap?
Una “URL no canónica en mi sitemap” se refiere a una situación en la que las URLs listadas en el sitemap de tu sitio web no son las versiones canónicas de esas páginas. Las URLs canónicas son las versiones preferidas de un conjunto de páginas duplicadas o muy similares en tu sitio. La URL canónica es aquella que deseas que los motores de búsqueda consideren como la versión principal o autorizada.
Cuando una página no canónica está presente en tu sitemap, el código fuente HTML de esa página podría incluir una etiqueta canónica que apunte a un enlace diferente al que figura en el sitemap. Así se vería:
Escenario de ejemplo
Sitemap: https://example.com/page-a
Canónica: https://example.com/page-b
Código fuente HTML de https://example.com/page-a
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Página A</title>
<!-- Etiqueta canónica que apunta a la Página B -->
<link rel="canonical" href="https://example.com/page-b">
</head>
<body>
<h1>Esta es la Página A</h1>
<p>Contenido de la Página A...</p>
</body>
</html>
Problemas demostrados
1. URL en el Sitemap: El sitemap contiene https://example.com/page-a.
2. Etiqueta canónica: El HTML de https://example.com/page-a contiene un enlace canónico que apunta a https://example.com/page-b
Implicaciones
1. Confusión para los motores de búsqueda. Los motores de búsqueda ven https://example.com/page-a en el sitemap, pero la etiqueta canónica les indica que https://example.com/page-b es la versión autorizada.
2. Contenido duplicado. Los motores de búsqueda pueden tratar https://example.com/page-a como contenido duplicado y no indexarlo ni posicionarlo como deseas.
Enfoque correcto
Para solucionarlo, asegúrate de que la página incluida en tu sitemap sea la URL canónica.
Sitemap actualizado
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/page-b</loc>
<lastmod>2023-06-01</lastmod>
<priority>0.8</priority>
</url>
</urlset>
Código fuente HTML de https://example.com/page-b
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Página B</title>
<!-- Etiqueta canónica apuntando a sí misma -->
<link rel="canonical" href="https://example.com/page-b">
</head>
<body>
<h1>Esta es la Página B</h1>
<p>Contenido de la Página B...</p>
</body>
</html>
Al asegurarte de que la URL en el sitemap coincida con la etiqueta canónica, proporcionas una orientación clara a los motores de búsqueda, ayudándoles a indexar y posicionar correctamente tu contenido.
¿Qué provoca este problema?
Varios factores pueden provocar que aparezcan URLs no canónicas en tu sitemap. A continuación, se presentan algunos desencadenantes comunes:
1. Múltiples versiones de una misma página
- HTTP vs. HTTPS: Pueden existir ambas versiones http://example.com y https://example.com.
- WWW vs. sin WWW: Tanto http://www.example.com como http://example.com pueden ser accesibles.
- Barras inclinadas finales: Pueden existir tanto http://example.com/page como http://example.com/page/.
2. Parámetros de URL
Es posible acceder a las páginas mediante distintos parámetros en la URL (por ejemplo, http://example.com/page?ref=google frente a http://example.com/page). Aunque el contenido sea el mismo, pueden existir enlaces distintos por motivos de seguimiento o sesión.
3. Configuración del sistema de gestión de contenidos (CMS)
Algunos CMS pueden generar múltiples URLs para el mismo contenido, según cómo se enlacen o categoricen las páginas. Por ejemplo, WordPress puede crear URLs distintas para la misma entrada dependiendo de la categoría o los archivos de etiquetas.
4. Paginación
El contenido paginado puede generar distintas URLs para una misma página canónica (por ejemplo, http://example.com/page/2 puede tener como canónica a http://example.com/page).
5. Contenido duplicado
La duplicación intencionada o accidental de contenido en diferentes URLs puede hacer que varias versiones del mismo contenido estén disponibles en tu sitio web.
6. Etiquetas canónicas incorrectas
Las etiquetas canónicas mal configuradas pueden apuntar a la URL equivocada, lo que genera discrepancias con la URL listada en el sitemap.
7. Generadores automáticos de sitemaps
Algunas herramientas automatizadas de generación de sitemaps pueden incluir URLs sin comprobar adecuadamente las etiquetas canónicas, lo que da lugar a inconsistencias.
8. Errores manuales en el sitemap
Cuando los sitemaps se crean o editan manualmente, los errores humanos pueden provocar la inclusión de URLs no canónicas.
¿Cómo comprobarlo?
1. Herramienta de auditoría SEO de Sitechecker
En la sección de Auditoría del sitio, bajo “Indexabilidad”, puedes encontrar diferentes problemas relacionados con las etiquetas “Canónicas”. Esta función de nuestra herramienta está diseñada para ayudarte a descubrir y resolver múltiples problemas relacionados con las URLs canónicas que podrían estar afectando el rendimiento SEO de tu sitio web. La herramienta identifica problemas como etiquetas canónicas que apuntan a enlaces sin HTTPS, canónicas ausentes o configuradas con ‘noindex, nofollow’, entre otros.

Al hacer clic en “Ver problema” en cada categoría, accedes a una lista detallada de páginas afectadas por ese tipo de error canónico.

¡Optimiza tu SEO con etiquetas canónicas precisas!
Descubre el poder de una implementación adecuada de etiquetas canónicas con nuestro verificador fácil de usar.
2. Google Search Console
- Sube tu sitemap a Google Search Console.
- En la sección “Índice”, navega a “Sitemaps” para ver si hay problemas con las URLs.
- Utiliza el informe de “Cobertura” para identificar discrepancias entre los enlaces enviados e indexados.

3. Inspección manual
Descargar e inspeccionar el sitemap
- Descarga tu archivo sitemap (normalmente se encuentra en https://example.com/sitemap.xml).
- Verifica manualmente una muestra de los enlaces del sitemap comparándolos con las páginas canónicas especificadas en el HTML.
Ver el código fuente de la página
- Abre el código fuente HTML de los enlaces listados en tu sitemap.
- Busca la etiqueta <link rel=”canonical” href=”URL”>.
- Verifica que el enlace de la etiqueta canónica coincida con el que aparece en el sitemap.
4. Scripts automatizados
Puedes utilizar scripts automatizados para comprobar la existencia de enlaces no canónicos. Aquí tienes un script básico en Python usando las bibliotecas requests y BeautifulSoup:
import requests
from bs4 import BeautifulSoup
def get_canonical_url(page_url):
response = requests.get(page_url)
soup = BeautifulSoup(response.content, 'html.parser')
canonical_link = soup.find('link', rel='canonical')
if canonical_link:
return canonical_link['href']
return None
def check_sitemap(sitemap_url):
response = requests.get(sitemap_url)
soup = BeautifulSoup(response.content, 'xml')
urls = [loc.text for loc in soup.find_all('loc')]
for url in urls:
canonical_url = get_canonical_url(url)
if canonical_url and canonical_url != url:
print(f"Se encontró una URL no canónica:\n URL en el sitemap: {url}\n URL canónica: {canonical_url}")
sitemap_url = 'https://example.com/sitemap.xml'
check_sitemap(sitemap_url)
Al usar estos métodos, puedes identificar y resolver eficazmente los enlaces no canónicos en tu sitemap, asegurando un mejor rendimiento SEO y una orientación más clara para los motores de búsqueda.
Cómo prevenir y corregir el problema
Para prevenir y corregir el problema de las páginas no canónicas en tu sitemap, hay varias buenas prácticas que debes seguir.
Primero, asegúrate de que cada página de tu sitio incluya una etiqueta canónica. Esto implica añadir la etiqueta <link rel=”canonical” href=”URL”> en el HTML de cada página, apuntando a la versión canónica.
Luego, mantén una estructura de URL coherente en todo tu sitio. Esto significa estandarizar el uso de HTTP vs. HTTPS, decidir si incluir “www” en tus URLs y ser consistente con las barras inclinadas finales.
También es crucial configurar correctamente tu sistema de gestión de contenidos (CMS). Asegúrate de que tu CMS genere páginas coherentes y maneje adecuadamente el contenido duplicado.
El uso de redirecciones 301 es otra estrategia eficaz. Implementa estas redirecciones para guiar a los usuarios y motores de búsqueda desde páginas no canónicas a sus equivalentes canónicos. Esto ayuda a consolidar la autoridad de los enlaces y evita problemas de contenido duplicado.
Revisa también cómo se genera tu sitemap. Utiliza herramientas fiables que respeten las etiquetas canónicas y las configuraciones del sitio. Revisa periódicamente tu sitemap para asegurarte de su precisión y actualízalo cuando sea necesario.
Por último, monitorea y audita tu sitio regularmente. Utiliza Sitechecker para escanear tu sitio y detectar URLs no canónicas, resolviendo rápidamente los problemas que surjan.
Si sigues estas prácticas, asegurarás que tu sitemap refleje con precisión las páginas canónicas de tu sitio web, mejorando así el rendimiento SEO y reduciendo la confusión para los motores de búsqueda.
Conclusión
Un “enlace no canónico en mi sitemap” se refiere a URLs dentro de tu sitemap que no son las versiones canónicas. Las URLs canónicas son las versiones preferidas de las páginas que deseas que los motores de búsqueda indexen. Si una URL no canónica aparece en tu sitemap, el HTML de esa página podría apuntar a otra URL como canónica, lo que puede confundir a los motores de búsqueda y generar problemas de contenido duplicado. Para solucionarlo, asegúrate de que tu sitemap incluya solo páginas canónicas, estandariza la estructura de tus URLs, configura correctamente tu CMS, utiliza redirecciones 301 y audita regularmente tu sitio con herramientas SEO para mantener la precisión y mejorar el rendimiento SEO.