O que é uma URL Não Canônica em um Sitemap?
Uma “URL não canônica no meu sitemap” refere-se a uma situação em que as URLs listadas no sitemap do seu site não são as versões canônicas dessas páginas. As URLs canônicas são as versões preferenciais de um conjunto de páginas duplicadas ou muito semelhantes em seu site. A URL canônica é aquela que você deseja que os mecanismos de busca considerem como a versão principal ou autorizada.
Quando uma página não canônica está presente no sitemap, o código-fonte HTML da página pode incluir uma tag canônica apontando para um link diferente do listado no sitemap. Veja um exemplo:
Cenário de Exemplo
Sitemap: https://example.com/page-a
Canônica: https://example.com/page-b
Código-fonte HTML de https://example.com/page-a
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Página A</title>
<!-- Tag canônica apontando para a Página B -->
<link rel="canonical" href="https://example.com/page-b">
</head>
<body>
<h1>Esta é a Página A</h1>
<p>Conteúdo da Página A...</p>
</body>
</html>
Problemas Demonstrados
1. URL no Sitemap: O sitemap contém https://example.com/page-a.
2. Tag Canônica: O HTML de https://example.com/page-a contém uma tag canônica apontando para https://example.com/page-b
Implicações
1. Confusão para os mecanismos de busca. Os buscadores veem https://example.com/page-a no sitemap, mas a tag canônica informa que https://example.com/page-b é a versão principal.
2. Conteúdo duplicado. Os motores de busca podem tratar https://example.com/page-a como conteúdo duplicado e não indexá-lo ou ranqueá-lo conforme o desejado.
Abordagem Correta
Para corrigir isso, certifique-se de que a página listada no seu sitemap seja a URL canônica.
Sitemap Atualizado
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/page-b</loc>
<lastmod>2023-06-01</lastmod>
<priority>0.8</priority>
</url>
</urlset>
Código-fonte HTML de https://example.com/page-b
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Página B</title>
<!-- Tag canônica apontando para si mesma -->
<link rel="canonical" href="https://example.com/page-b">
</head>
<body>
<h1>Esta é a Página B</h1>
<p>Conteúdo da Página B...</p>
</body>
</html>
Ao garantir que a URL no sitemap corresponda à URL canônica, você fornece orientações claras aos mecanismos de busca, ajudando-os a indexar e classificar corretamente o seu conteúdo.
O que causa esse problema?
Diversos fatores podem fazer com que URLs não canônicas apareçam no seu sitemap. Abaixo estão alguns dos gatilhos mais comuns:
1. Múltiplas versões de uma mesma página
- HTTP vs. HTTPS: Podem existir as versões http://example.com e https://example.com.
- WWW vs. sem WWW: Tanto http://www.example.com quanto http://example.com podem estar acessíveis.
- Barras finais: As URLs http://example.com/page e http://example.com/page/ podem ser tratadas como diferentes.
2. Parâmetros de URL
As páginas podem ser acessadas com diferentes parâmetros de URL (ex: http://example.com/page?ref=google vs. http://example.com/page). Embora o conteúdo seja o mesmo, diferentes links podem ser usados para fins de rastreamento ou sessão.
3. Configuração do CMS (Sistema de Gerenciamento de Conteúdo)
Alguns CMSs podem gerar múltiplas URLs para o mesmo conteúdo, dependendo da forma como as páginas são vinculadas ou categorizadas. Por exemplo, o WordPress pode criar URLs diferentes para o mesmo post com base na categoria ou nos arquivos de tags.
4. Paginação
Conteúdo paginado pode gerar diferentes URLs para a mesma página canônica (ex: http://example.com/page/2 pode ter como canônica a http://example.com/page).
5. Conteúdo duplicado
A duplicação intencional ou acidental de conteúdo em diferentes URLs pode resultar em várias versões acessíveis do mesmo conteúdo.
6. Tags canônicas incorretas
Tags canônicas mal configuradas podem apontar para a URL errada, fazendo com que a URL do sitemap seja diferente da que está definida como canônica.
7. Geradores automáticos de sitemap
Algumas ferramentas automáticas de geração de sitemaps podem incluir URLs sem verificar corretamente as tags canônicas, gerando inconsistências.
8. Erros manuais no sitemap
Quando os sitemaps são criados ou editados manualmente, erros humanos podem levar à inclusão de URLs não canônicas.
Como verificar isso?
1. Ferramenta de Auditoria SEO do Sitechecker
Na seção de Auditoria do Site, em “Indexabilidade”, você pode encontrar diferentes problemas relacionados a URLs canônicas. Este recurso da nossa ferramenta foi desenvolvido para ajudar você a identificar e resolver diversos problemas relacionados a canonical tags que podem afetar o desempenho de SEO do seu site. A ferramenta aponta problemas como canônicas apontando para links sem HTTPS, canônicas ausentes ou configuradas com ‘noindex, nofollow’, entre outros.

Ao clicar em “Ver problema” em cada categoria, você acessa uma lista detalhada das páginas afetadas por esses problemas específicos.

Otimize seu SEO com Tags Canônicas Precisas!
Descubra o poder do uso correto de canonical tags com nosso verificador fácil de usar.
2. Google Search Console
- Envie seu sitemap ao Google Search Console.
- No menu “Índice”, vá até “Sitemaps” para verificar se há problemas com as URLs.
- Use o relatório de “Cobertura” para identificar discrepâncias entre os links enviados e os indexados.

3. Inspeção manual
Baixe e analise o sitemap
- Baixe o arquivo do seu sitemap (geralmente disponível em https://example.com/sitemap.xml).
- Verifique manualmente uma amostra dos links do sitemap comparando com as URLs canônicas indicadas no HTML de cada página.
Visualizar o código-fonte da página
- Abra o código-fonte HTML dos links listados no seu sitemap.
- Procure pela tag <link rel=”canonical” href=”URL”>.
- Verifique se o link da tag canônica corresponde ao link listado no sitemap.
4. Scripts automatizados
Você pode usar scripts automatizados para verificar URLs não canônicas. Aqui está um script básico em Python usando as bibliotecas requests e BeautifulSoup:
import requests
from bs4 import BeautifulSoup
def get_canonical_url(page_url):
response = requests.get(page_url)
soup = BeautifulSoup(response.content, 'html.parser')
canonical_link = soup.find('link', rel='canonical')
if canonical_link:
return canonical_link['href']
return None
def check_sitemap(sitemap_url):
response = requests.get(sitemap_url)
soup = BeautifulSoup(response.content, 'xml')
urls = [loc.text for loc in soup.find_all('loc')]
for url in urls:
canonical_url = get_canonical_url(url)
if canonical_url and canonical_url != url:
print(f"URL não canônica encontrada:\n URL no Sitemap: {url}\n URL Canônica: {canonical_url}")
sitemap_url = 'https://example.com/sitemap.xml'
check_sitemap(sitemap_url)
Ao usar esses métodos, você pode identificar e corrigir com eficiência os links não canônicos em seu sitemap, garantindo melhor desempenho SEO e instruções mais claras para os motores de busca.
Como prevenir e corrigir o problema
Para prevenir e corrigir o problema de páginas não canônicas no seu sitemap, existem algumas boas práticas que você deve seguir.
Primeiro, certifique-se de que cada página do seu site contenha uma tag canônica. Isso envolve adicionar a tag <link rel=”canonical” href=”URL”> no HTML de cada página, apontando para sua versão canônica.
Em seguida, mantenha uma estrutura de URL consistente em todo o site. Isso significa padronizar o uso de HTTP versus HTTPS, decidir se deve usar ou não “www” nas URLs e ser consistente com o uso de barras finais.
Uma configuração correta do seu CMS (Sistema de Gerenciamento de Conteúdo) também é essencial. Garanta que ele gere URLs consistentes e trate o conteúdo duplicado adequadamente.
O uso de redirecionamentos 301 é outra estratégia eficaz. Implemente esses redirecionamentos para conduzir usuários e motores de busca de páginas não canônicas para suas versões canônicas. Isso ajuda a consolidar a autoridade dos links e a evitar problemas com conteúdo duplicado.
Também é importante revisar como seu sitemap é gerado. Use ferramentas confiáveis que respeitem as tags canônicas e configurações definidas no seu site. Verifique regularmente a precisão do seu sitemap e atualize-o conforme necessário.
Por fim, monitore e audite seu site com frequência. Utilize o Sitechecker para escanear seu site e identificar URLs não canônicas, resolvendo rapidamente quaisquer problemas encontrados.
Seguindo essas práticas, você garante que seu sitemap represente corretamente as páginas canônicas do seu site, melhorando o desempenho em SEO e reduzindo a confusão para os motores de busca.
Consideração final
Um “link não canônico no meu sitemap” refere-se a URLs no seu sitemap que não são as versões canônicas. URLs canônicas são as versões preferidas das páginas que você quer que os motores de busca indexem. Se um link não canônico estiver no seu sitemap, o HTML da página pode apontar para outra página como canônica, o que causa confusão nos motores de busca e pode levar a problemas com conteúdo duplicado. Para resolver isso, certifique-se de que seu sitemap inclua apenas páginas canônicas, padronize suas estruturas de URL, configure corretamente seu CMS, use redirecionamentos 301 e audite regularmente seu site com ferramentas de SEO para manter a precisão e melhorar o desempenho.