O verdadeiro perigo de conteúdo duplicado

Como na internet as coisas estão sempre a mudar, e a uma velocidade que nem sempre é fácil de acompanhar, achei que seria interessante abordar a questão do conteúdo duplicado, e da penalização que normalmente se pensa estar associada a este tipo de conteúdo.  Aproveito também para actualizar alguma informação que possa ter sido aqui publicada no blog a este respeito e que hoje esteja desactualizada.

Antes de ir mais longe, convém desde já dizer que a chamada penalização por conteúdo duplicado não existe.  O que normalmente acontece é que o Google filtra (e não penaliza) o conteúdo de forma a apresentar apenas uma versão nos motores de busca.  Assim, o conteúdo duplicado é filtrado de forma a aparecer apenas a versão tida como original (ou mais relevante), mas os outros sites que possam ter o mesmo conteúdo não estão a ser penalizados no sentido tradicional da palavra.

Salvo raras excepções, em que há uma tentativa clara de incluir conteúdo muito parecido no mesmo site de forma a que este indexe melhor para certas pesquisas, não há que temer penalizações por o mesmo conteúdo aparecer em duplicado no mesmo site.

Como evitar o conteúdo duplicado

Outra forma de conteúdo duplicado acontece em sites que cujo conteúdo é quase todo ele obtido de outros sites normalmente através de feeds.

O ideal em situações em que boa parte do conteúdo de um site é duplicado de outros sites é oferecer alguma espécie de valor acrescentado.  Isto pode ser feito acrescentando algum conteúdo original, conjugado com a forma como a informação é organizada e catalogada, de forma a oferecer algum valor acrescentado ao internauta.

O Google tem várias forma de “medir” este valor acrescentado de um determinado site, seja através do “bouce rate”, ou do tempo que o visitante permanece no site.

Eu tenho falado com algumas pessoas, que mesmo usado auto-blogging, conseguem construir sites muito visitados, que indexam bem e são muito lucrativos, simplesmente porque conseguiram oferecer valor acrescentado, mesmo tendo em conta que (quase) todo o conteúdo é recolhido de outros sites.

No fim de contas, a página que o Google apresenta numa qualquer pesquisa é aquela que o Google pensa melhor servir os interesses do internauta, e não tem, por exemplo, que ser necessariamente o directório de artigos onde o texto foi primeiro publicado.

O verdadeiro perigo de conteúdo duplicado

Na maioria das instâncias o conteúdo duplicado acontece dentro do mesmo site e de forma totalmente não intencional, onde o mesmo conteúdo aparece em páginas com URL´s diferentes.  Eis alguns exemplos de duplicação de conteúdo que poderiam estar a acontecer aqui no blog:

  • dinheirooportunidade.com
  • www.dinheirooportunidade.com
  • dinheirooportunidade.com/index.php
  • www.dinheirooportunidade.com/index.php

Isto seria um exemplo onde a mesma página estaria disponível em quatro URL distintos.  Num cenário destes o Google escolhe um dos URL´s  para exibir para uma determinada pesquisa.   Normalmente o Google escolhe a melhor página para ser exibida, mas isso pode nem sempre acontecer.

Um site também não é “penalizado” por este tipo de conteúdo duplicado, mas há no entanto alguns resultados bastante negativos:

Diluição do chamado “link juice” (PageRank) – Usando o exemplo dado em cima, imaginem que havia apenas 4 sites a linkar para o meu blog, e que por qualquer razão, cada um destes sites “linkava” para um dos URL´s que eu dei em cima como exemplo.  Assim, e em vez de ter um URL (no meu caso seria este: dinheirooportunidade.com) com um PageRank bastante elevado, eu teria 4 URL´s diferentes com um pouco de PageRank cada um. Isto poderia fazer com que em vez de o meu site estar bem indexado para uma qualquer pesquisa, ele fosse menos valorizado pelo Google nos motores de busca.  A diluição do PageRank pode ser um dos efeitos mais negativos em ter o mesmo contéudo em várias páginas do mesmo site.

Efeito prejudicial no branding – Quando as pessoas pensam no meu blog eu quero que elas pensem DinheiroOportunidade.com e não em algo do tipo www.dinheirooportunidade.com/index.php. Já viram se numa conversa de café tentassem dizer a um amigo que o URL do meu blog  era “www dinheirooportunidade.com slash index.php“.  Assim, e para evitar confusões entre pessoas menos habituadas a estas andanças eu optei para que o meu site tivesse apenas um URL: DinheiroOportunidade.com.  Esta simplificação e eliminação de palavras desnecessárias no URL ajuda a fortalecer a marca (“branding).

Desperdícios de recursos – É provavelmente o menos importante, mas não deixa de ser um factor a ter em conta: os recursos e tempo que o Google gasta a visitar (“crawl”) e indexar todas as páginas com conteúdo duplicado de um site.  Pensando que não, e por exemplo em blogs WordPress, o mesmo conteúdo pode ser encontrado em dezenas de páginas distintas.  Basta pensar que cada “tag” num post gera uma versão diferente o post, ou seja, um post com 6 “tags” vai ter 6 URL´s diferentes só a conta dos “tags”.  O mesmo acontece com as categorias.

Resumindo

A menos que tenham um blog muito lido, e criem um serviço de link building, a probabilidade de verem um ou dois dos vossos sites penalizados nos motores de busca por conteúdo duplicado (??) é praticamente impossível…

Comentários? Opiniões?

Tags: , ,

26 comentários em “O verdadeiro perigo de conteúdo duplicado”
  1. O Google está tão evoluído que já contorna tudo isso.

    Especula-se sobre certas coisas que nem sabem se é verdade. O Google pouco ou nada confirma sobre o funcionamento do seu motor de busca. Quanto muito, certo funcionário afirmam, mas sabemos se é realmente certo? Não sabemos. Nem eles sabem tudo!

  2. Artur Fuste says:

    Olá Custódio,

    Já tinha falado com várias pessoas acerca de conteúdo duplicado. Não é tão grave como inicialmente se previa.

    Já fiz testes e o conteúdo que fui buscar a outros sites, (indicando sempre a fonte), por vezes ficam melhor colocados que os originais!!!

  3. Tomé M. says:

    Artigos que vêm mesmo a calhar. Muito obrigado estava a precisar de uma informações destas.

    Só mais uma nota: quando menconas o “link juice” podias ter referido como o evitar. Explicando que é possível alterar o .htaccess por forma a reencaminhar para um só tipo de link.

    • No ” Webmarter tools google” que é um serviço parecido com o ggole analytics podes inserir o teu blog ou website e depois tens várias definições muito uteis… uma delas é escolher se queres o teu URL com ou sem www.

      Ele envia todo o trafego para aquele que escolheres.

      A titulo de curiosidade: existem sites com um PR diferente na versão com wwww e na versão sem www

  4. Hugo Santos says:

    eu sempre achei que o conteudo duplicado era um falso problema, principalmente em sites que tem conteudo de outros sites.

  5. Sim, é verdade. O Google não desindexa um site por apresentar conteudo duplicado… ele apenas acha (e com razão) que as pessoas não querem ler duas vezes a mesma coisa e por isso apenas apresenta a versão mais bem “cotada”.

    E bem cotada não tem a ver com o Page Rank mas sim com o outro conteudo do blog. O Google dá preferencia a um blog cujo post esteja dentro da sua tematica em depreciação de um outro blog de PR mais elevado mas cujo conteudo não seja maioritariamente relacionado com esse post.

    Claro que as coisas não são assim tão lineares mas basicamente é isso que acontece.

  6. Pedro T says:

    O conteúdo duplicado pode ajudar a propagar mais do mesmo, mas em termos do mecanismo de indexação acho que nada é linear. E já houve casos de bloggers que viram os seus blogues desindexados do google como penalização por conteúdo duplicado.
    Mas, acho que nada feito pelo google é linear.. mas enfim.

  7. João says:

    Olá Custódio…

    Tenho que concordar contigo, pois recentemente, estive a ler uma noticia em que o Google tinha evoluído mas para uma óptica do utilizador, isto é, ele considera como os melhores resultados para os internautas, os sites com maior actividade.
    Por outras palavras se um site possui muitas visitas diárias e o tempo médio no site é favorável, então o site apresenta conteúdo relevante, logo é um bom resultado para os internautas.
    Obviamente, que os outros indicadores continuam com peso relevante, mas é a actividade que maior peso possui agora no algoritmo.
    Até já…

  8. Particularmente acho que há muito a esclarecer sobre esse assunto.

    Essa questão do conteúdo duplicado ficar melhor posicionado do que o conteúdo original dá o que pensar.

    Em alguns casos raros e muito específicos pode até ser verdade, mas em regra geral não posso crer que o Google posicione melhor um site que copiou conteúdo de outro.

    Isso é tirar o mérito de quem produziu o tão aclamado e valorizado conteúdo único que o Google tanto gosta.

    Imaginem se a moda pega. Teremos uns quantos escravos a escrever conteúdo original e outros milhões a copiá-los.

    Mas vindo do Google tudo é possível…

  9. Se conteudo duplicado desse penalização, milhões de blogs nem mais existiriam. Que um exemplo? O texto “Política de Privacidade” é copiadíssimo!

    Quem foi punido?

  10. Realmente o conteúdo duplicado é algo que devemos evitar.

    O bom para quem usa WordPress e configura a url sem o www, quando alguém acessa com o www ele redireciona para a que foi configurada como padrão. Ou seja, esse problema já é evitado por quem usa WordPress. No caso de um site estático, ai é preciso ir no painel do hosting e alterar nas opções de DNS para que funcione somente com ou sem www, conforme a preferência de cada um, e ainda há como fazer por .htaccess.

    Quando um blog fica com esse /index.php depois do domínio e usa WordPress, é quase sempre porque está hospedado em um servidor Windows. Uma vez eu contratei uma hospedagem Windows, e por ter problemas com as URLs mudei de volta para Linux.

  11. Mais um bom artigo, a promover alguma discussão, de forma que todos aprendemos mais um pouco.
    (Excelente imagem. Não devias colocar os créditos? ;) )

  12. Leonardo says:

    Conteúdo Duplicado é sempre tema para um bom post Custódio!
    Parabéns por elucidar a questão
    .
    Em todo caso há os plugins que não permitem cópia, já fiz posts no meu blog sobre ele (http://profissionalblogger.com/como-acabar-com-o-plagio-wp-copy-protector/).

    Eu acho que desde que divulgado de onde veio a fonte, não há problema nenhum….

  13. Fabio says:

    Olá Custódio, já faz um bom tempo que acompanho seu blog, mas nunca comentei, mas tenho uma grande dúvida.

    Se os artigos duplicados não tem tanta importância assim, então não tem problema criar um artigo em meu blog, esperar o google indexar, e depois colocar esse mesmo artigo em vários diretorios de conteúdos como por exemplo o Artigonal ou outros iguais?

    Um abraço!!!

  14. João says:

    Custódio,

    Excelente, tenho tido um trabalho incrível devido ao conteúdo duplicado no meu blog, pois devido às reviews de produtos e agregação numa página de arquivo leva-me a possuir conteúdo “mais ou menos duplicado”.
    Agora estou mais descansado..

    Obrigado..

  15. Carlos says:

    Olá Custódio,
    referiste que cada tag cria uma versão diferente do artigo.

    A minha questão é: Devemos ou não inserir muitas tags (no caso dos blogs wordpress)?

    Incluir muitas tags prejudica-nos em termos de posicionamento do artigo no Google?

  16. Alexia says:

    Ola Custodio!
    Muito informativo este post, bom saber que conteudo duplicado nao e tao grave. Eu tenho, alem do meu blog em Portugues, um site em ingles onde ensino frances online, e apesar de nao copiar conteudo, assuntos tipo numeros em frances, alfabeto, verbos e tal sempre vao aparecer em outros sites tambem, dai o conteudo duplicado. Sinceramente nao sei ate que ponto o google “entende” que nao da para mudar esse tipo de informacao para ficar “unico e original”. A nao ser que eu crie um novo Frances ;p
    Parabens pelo blog e sucesso.

  17. Vaca Fria says:

    Olá Custodio
    Sou um caloiro com um ano de experiência e apaixonado pela internet. Já aprendi muito contigo e espero continuar, assim como ter alguma recompensa monetária com a brincadeira.

    Uma vez que o meu blog é recente (março 2010), já aconteceu que num post meu copiado por outros, no motor de busca da google surgia em primeiro que eu. (E claro, o post sem a fonte (meu link)).

    Desta forma, não me parece que a google penalize o copy/paste… nem que dê importância ao original.

    Abraço.

  18. Muito bom Custódio. Espero um artigo seu falando também sobre pagerank.

  19. Tiago says:

    Custodio perdoa-me o off-topic mas quanto tempo demoras mais ou menos a responder a um email ( neste caso o meu :P )

  20. Plagio says:

    Espero que a penalização não seja severa…. Embora o google ainda não indexe revistas, pois o senhor João Pedro Sousa copiou-lhe o artigo na revista Sim. Ou vice-versa…

  21. Roberto says:

    Bom dia,

    Não é por nada não, mas também não “custa” nada dar uma pequena reciclada no material disponível e dar uma acrescentada a mais nem que seja com suas próprias palavras para agregar valor a um site…. So é penalizado quem quer… ou é muito preguiçoso para só duplicar e ganhar dinheiro rapidamente por nenhum trabalho…

Deixe o seu comentário

(obrigatório)

(obrigatório)



Subscreve a newsletter gratuita e começa hoje mesmo a ganhar dinheiro na internet!

Categorias