Canônico: O Google ajuda a acabar com o conteúdo duplicado

20 / 02 / 2009   google* comente esse artigo

Na matemática, diz-se que uma equação é canônica se está na sua forma mais simples, por exemplo: (x^2 -1)/(x+1) não está na forma canônica, mas (x-1), que é o resultado da divisão, está.

conteudo duplicado

Conteúdo duplicado é um dos assuntos que mais gera controvérsia entre webdevigners (developer+designer) e SEOs em geral. Não se chega a um consenso, apesar de os sites de busca fornecerem bastante informação sobre o que é conteúdo duplicado ou não. Uma das principais preocupações de um blogueiro ou administrador de site antenado é evitar repetições dentro do próprio site. Um exemplo clássico que costumo dar é se há uma categoria com o mesmo nome de uma tag (internet, por exempl0) e TODOS os posts daquela categoria receberam também a mesma tag (leia aqui sobre a diferença entre categorias e tags). O resultado disso são duas páginas iguais, mas uma delas está em http://siteexemplo.com.br/categorias/internet e a outra em http://siteexemplo.com.br/tags/internet. Isso acontece e muito. Nunca vi um site ser punido por esse tipo de ocorrência, mas tem muita gente preocupada. Para evitar punição nos casos em que duas URLs diferentes levam ao mesmo conteúdo, o Google criou uma nova tag a ser inserida no html, trata-se do “canonical”.

Se no seu site há duas páginas com urls diferentes e mesmo conteúdo, agora é possível informar ao Google qual URL deve ser indexada. Para fazer isso basta adicionar um <link> no cabeçalho da página e passar e especificar o relacionamento (“rel”) “canonical”. No exemplo acima, eu poderia adicionar a seguinte linha na página de categorias:

<link rel=”canonical”   href=”http://siteexemplo.com.br/tags/internet” />

Quando o Google encontrar esse comando no cabeçalho (<header>) da página de categorias, entenderá que a página que dever ser indexada é a de tags. O melhor de tudo isso é que as características como o pagerank também são transferidas.

O Google também preparou um faq sobre canonical que reproduzo abaixo (a partir desse momento, “Nós” é o Google falando, não o Webcétera).

[Google]

rel=”canonical” é uma indicação  (hint) ou diretiva?
É uma indicação que recomendamos fortemente. Levaremos em conta sua preferência, em conjunto com outros fatores, quando calcularmos a página mais relevante para exibir nos resultados da busca.

Posso utilizar um caminho relativo para especificar o canonical, como <link rel=”canonical” href=”tags/internet” />?
Sim, caminhos relativos são reconhecidos da forma esperada quando se utiliza a tag <link>. Se você incluir a tag <base> na sua página, caminhos relativos serão resolvidos de acordo com essa URL base.

Há alguma problema se a canônica não é uma cópia exata do documento?
Nós permitimos pequenas diferenças, por exemplo, na ordenação de uma tabela de produtos. Também poderemos varrer a página canônica e a duplicada em momentos distintos, então poderemos “ver” versões diferentes do seu conteúdo. Para nós tudo isso está correto.

E se o link em rel=”canonical” retornar um 404 (página não econtrada)?
Nós continuaremos a indexar seu conteúdo e utilizar um algorítimo heurístico para encontrar a canônica, mas recomendamos que você específica uma URL válida como canônica.

E se a URL em rel=”canonical” ainda não tiver sido indexada?
Como todos os documentos públicos na web, nós nos esforçamos para varrer rapidamente a URL designada como canônica. Assim que a indexarmos, nós imediatamente levaremos em consideração a indicação rel=”canonical”

rel=”canonical” pode ser um redirecionamento?
Sim, você pode especificar uma URL que redireciona como sua URL canônica. O Google então irá processar o redirecionamento da forma comum e tentará indexar o resultado.

E seu eu tiver rel=”canonical” contraditórios?
Nosso algorítimo tenta “suavizar”: nós podemos seguir cadeias canônicas, mas recomendamos fortemente que você atualize os seus links para apontar para uma única página canônica como forma de garantir resultados canônicos ótimos.

Posso indicar um canônico em um domínio diferente?
Não. Para migrar para um domínio diferente, um redirecionamento permanente (301) é mais apropriado. O Google aceitará sugestões canônicas entre contas em subdomínios, mas não entre domínios. Por exemplo, www.exemplo.com vs. exemplo.com vs ajuda.exemplo.com são aceitas, mas exemplo.com vs. outro-domínio.com não é aceito.

[/Google]

enviado por Marcos V.

Digg It! Digg It! Del.icio.us