Quando começa a envolver-se mais com SEO, mais cedo ou mais tarde, irá deparar-se com o problema do conteúdo duplicado. Isto não é uma situação nova, já existe há algum tempo, o que significa que vários métodos foram desenvolvidos para o resolver. Estão aqui alguns deles.
Bloqueio utilizando robots.txt
Este é o método mais antigo, mas também o mais utilizado. A ideia é que o ficheiro robots.txt bloqueia um domínio ou página específica, impedindo que o motor de pesquisa do Google os encontre e indexe. A desvantagem desta solução é que, se alguém estabelecerr um link para a sua página bloqueada, o Google não poderá seguir essa ligação. Isto faz com que seja um método menos eficaz para a otimização do SEO, contudo ainda pode ser útil se pretender bloquear certo conteúdo, independentemente de ser duplicado ou não.
Meta Robots Noindex/Follow tag
<meta nome=“robôs” conteúdo=“semindexação, seguir” />
Com esta etiqueta (noindex), podemos prevenir motores de pesquisa de indexar uma página, evitando efetivamente a duplicação. O seguinte valor diz ao motor de pesquisa para seguir os links na página. Este método é particularmente útil para blogs, onde o conteúdo primário a ser indexado é o próprio blog, enquanto o conteúdo secundário, como publicações arquivadas, podem ser acedidas por motores de pesquisa. Isto garante que o conteúdo mais antigo continua disponível sem causar problemas de duplicação.
Redirecionar 301
Na maioria dos casos, a solução mais eficaz para conteúdo duplicado é utilizar o Redirecionar 301, que redireciona motores de pesquisa da página duplicada para a original. Ao juntar páginas com classificações de página potencialmente fortes numa única página, eles não irão competir um com o outro. Em vez disso, a sua relevância combinada irá melhorar, o que é um impacto positivo no SEO. O Redirecionar 301 deve ser utilizado quando o redirecionamento não tem um impacto negativo na experiência do utilizador. Os casos de utilização normais incluem o redirecionamento de conteúdos sem um endereço IP, ficheiro de indexação, variações www ou não-www.
Tag canônica
Outro método para lidar com o conteúdo duplicado é utilizar rel=canonical tag. Esta tag oferece os mesmos benefícios de PageRank que o Redirecionamento 301, mas é mais fácil de implementar. A etiqueta rel=canonical é colocado na secção do cabeçalho HTML da página web e tem o seguinte aspeto:
<link href=”hxxp://www.exemplo.pt/subpagina/” rel=”canônica” />
Esta tag informa os motores de pesquisa para tratarem da página como uma cópia do URL www.exemplo.pt/subpagina e que todos os links e conteúdos da página duplicada pertençam efetivamente à página original.
A etiqueta canónica é particularmente útil para websites que utilizam várias categorias e subcategorias, onde diferentes URLs podem conduzir para o mesmo conteúdo.
Tag de link alternativo
A etiqueta de link alternativo funciona de forma semelhante à etiqueta canônica, mas é maioritariamente utilizada para SEO internacional ou multilingual.
<link rel=”alternativo” hreflang=”en” href=”hxxp://www.exemplo.com/algo” />
<link rel=”alternativo” hreflang=”en” href=”hxxp://www.exemplo.pt/algo” />
<link rel=”alternativo” hreflang=”en” href=”hxxp://www.exemplo.de/algo” />
A etiqueta alternativa ajuda o Google a identificar o conteúdo que é relevante ao país que se encontra. O lado negativo desta etiqueta é que o Google pode tratar algumas das nossas páginas como conteúdo duplicado. Pode ser utilizado para páginas que se dirigem a mais do que um país.
Google Search Console
Google Search Console permite que titulares de website definam o seu domínio preferencial e configuram diferentes parâmetros URL. A principal desvantagem deste método é que só afeta o Google. Motores de pesquisa como Bing ou Yahoo não serão influenciados por estas configurações.
Os métodos descritos acima não se destinam apenas ao tratamento de conteúdos duplicados, mas podem também ser utilizados de forma mais geral. Se existir uma subpágina do seu website que não quer que seja indexado pelos motores de pesquisa, deve tomar as medidas adequadas. Caso contrário, o motor de pesquisa pode, por engano, tratar a página como um erro 404.