english   italiano   español
 
4 June 2012
  • Imprimir   | EN| ES

    Conteúdo Duplicado Online: Questões, Problemas E O Lado Bom Da História


    Conteúdo duplicado: é essa uma questão com a qual você deva se preocupar? Independente do lado em que você esteja, se dos que publicam conteúdo que acaba sendo duplicado por aí ou dos que republicam o seu conteúdo com a contribuição de outros autores, é importante entender quais são as questões e problemas reais gerados por conteúdo duplicado e separá-los dos mitos e pura especulação acerca do tema.

    Robin-Good-duplicate-content-issues-480.jpg
    Veja o video de Robin Good sobre a questão do conteúdo duplicado mais abaixo nesse mesmo artigo

    A motivação para escrever este post veio de um e-mail, do qual gentilmente me fizeram parte, em que, de um lado, havia um webmaster que reclamava sobre o fato de que as duplicações do seu conteúdo tinham melhor posição no ranking das pesquisas do Google do que o seu artigo original.

    Superficialmente, poderia parecer que o autor original tem o direito de reclamar e pedir ao "republicador" que abandone a prática e comece a escrever material por conta própria.

    Mas, a questão, algumas vezes, principalmente quando você se aprofunda um pouco mais, mostra-se muito mais sutil e complexa do que parece.

    Aqui estão mais detalhes:

     


    Robin Good e a questão do conteúdo duplicado

     

    Duplicação de Conteúdo - Elementos-Chave

    Faz toda a diferença quando o site que copia ou duplica o conteúdo dá total crédito ao autor original e seu site não apenas na forma de citações, mas principalmente através de links redirecionando ao site original. Fornecer um link claramente visível redirecionando para o conteúdo original, que contenha tanto o nome do site como o do autor e o título do artigo original (com um link para ele também) é o mínimo que se deve fazer ao distribuir ou republicar um conteúdo já publicado anteriormente na internet.

    O segundo ponto-chave que pode causar uma reviravolta nessa situação é o fato de o site que duplica o conteúdo agregar "mais valor" ao original na forma de uma apresentação, links e referências adicionais, conteúdo relacionado e notícias sobre o mesmo assunto, imagens ilustrativas relevantes e mais conteúdo ainda, para o bem do próprio leitor.

    O terceiro ponto-chave é a permissão. Se você se deu ao trabalho de perder três minutinhos mandando um e-mail pedindo a autorização do dono do conteúdo para a sua republicação e explicou, de forma clara, o que pretende fazer com ele, certamente estará seguro também sob o ponto de vista moral. (Nunca ouvi ninguém reclamando sobre conteúdo duplicado que tenha sido previamente autorizado pelo autor)

    O que posso dizer a favor da duplicação de conteúdo pela rede é que, quando feito de forma ética (seguindo os três pontos acima) e também ampliando as formas com que as outras pessoas tem acesso a esse conteúdo, a prática pode ser na verdade muito positiva e constituir-se em uma maneira natural de espalhar boas ideias e informação valiosa.

    No outro extremo da questão, há sites que republicam conteúdo superficial, quase sem valor por centenas de domínios apenas para gerar monetização de tal conteúdo a custo zero para eles (no caso daqueles que usam artigos já prontos de diretórios de notícias) ou editores online menores que querem obter visibilidade de forma mais rápida, espalhando conteúdo de baixa qualidade nos diretórios, na esperança de ganhar muitos backlinks dos sites que republicarão seus artigos de modo gratuito.

    Mas, essa é a minha opinião.




    Como o Google Vê o Conteúdo Duplicado

    Aqui está o que o Google oficialmente diz sobre o assunto:

    "O conteúdo duplicado geralmente se refere a blocos de conteúdo dentro ou espalhado em domínios que tanto conferem com outro conteúdo já existente ou seja notadamente parecido. Na maioria dos casos, não se trata de conteúdo fraudulento na sua origem.

    Exemplos de conteúdos duplicados sem fundo prejudicial incluem:

    Fóruns de discussão que podem gerar páginas normais ou divididas em trechos direcionadas à distribuição em telefones celulares.

    Itens armazenados dispostos ou linkados via múltiplas URLs diferentes.

    Versões de páginas web somente para impressão.

    No entanto, em alguns casos, acontece de o conteúdo ser deliberadamente duplicado por domínios afora na tentativa de manipular os rankings dos buscadores ou gerar mais tráfego. Práticas fraudulentas como esta podem resultar em uma experiência de usuário empobrecida, quando o visitante encontra o mesmo conteúdo repetidas vezes dentro de um conjunto de resultados nas pesquisas.

    O Google tenta ostensivamente indexar e exibir páginas que contenham informações diferentes umas das outras.

    Em alguns casos raros em que o Google percebe que foi exibido conteúdo duplicado com a intenção de manipular os nossos rankings e fraudar os usuários, ajustes adequados serão feitos também na indexação e ranking dos sites envolvidos.

    Como resultado, o ranking do site pode sofrer penalizações, incluindo a total remoção do mesmo do sistema de indexação do Google, fazendo com que não mais figure nos resultados das pesquisas."

    Os típicos usuários do Google tem a tendência de querer ver uma seção diversa de conteúdos únicos quando fazem pesquisas. Em contraste, ficam irritados com razão quando vem o mesmo conteúdo substancialmente dentro de um grupo de resultados.

    "No entanto, preferimos concetrar-nos em filtrar o material mais do que em ajustar o ranking ... na grande maioria dos casos, a pior coisa que pode acontecer a um webmaster é ver a versão "menos desejada" da página exibida no nosso sistema de indexação."

    (Fonte: Google Webmaster Central)

    "O Google tenta ao máximo indexar e exibir páginas com informações diferentes umas das outras. [Geralmente filtramos os conteúdos duplicados] escolhemos um deles para configurar na lista.

    Nos raros casos em que o Google percebe que foi exibido conteúdo duplicado com a intenção de manipular os nossos rankings e fraudar os usuários, ajustes adequados serão feitos também na indexação e ranking dos sites envolvidos."

    (Fonte: Google Webmaster Central)




    Conteúdo Duplicado e Quem Aparece Primeiro no Ranking: Onde Está o Problema Mesmo?

    Agora, preste atenção nisso:

    A maioria dos problemas nos quais o Google interfere no que diz respeito a conteúdo duplicado geralmente é causada por duplicações existentes no próprio site e não por outras pessoas que o copiam por aí.

    Na verdade, vou criar um novo axioma aqui:

    Se houver um outro site fazendo republicações do seu conteúdo e com posição melhor no ranking no Google, DECIDIDAMENTE, você é quem tem um problema com o SEU site. (e o problema NÃO é sair gritando ou ameaçando quem republicou o seu conteúdo, mas acordar e ter a suficiente curiosidade de ir ver o que faz com que o desempenho do seu site seja tão ruim, a ponto de o Google preferir o conteúdo duplicado ao seu.)




    Quando Outro Site Republica o Seu Conteúdo, Você Deve Ficar Irritado ou Não?

    Tendo em vista a minha experiência diária no gerenciamento de alguns sites, a única preocupação do Google é proporcionar conteúdo de alta qualidade e relevante que combine exatamente com a pesquisa feita pelo usuário. Se outro site, que use o seu conteúdo consegue uma posição melhor no ranking, procure bem dentro do seu site pela razões para isso em vez de sair culpando quem o republicou.

    Também acho que você tem todo o direito de escrever e reclamar com os copiadores em busca da razão pela qual não entraram em contato com você antes de republicar o seu conteúdo (supondo que o seu conteúdo não seja veiculado sob um tipo de licença como a da Creative Commons).

    Mas, em muitos casos, o duplicador ou republicador (e com isso, excluo todos os sites bots e spams que roubam conteúdo de forma clara por questões econômicas apenas) não está tirando vantagem do seu conteúdo, mas ampliando e apoiando as suas ideias e campanhas, além de agregar valor a elas através de um link para o seu site e deixando bem claras a autoria e origem do conteúdo.

    Em todos estes casos, não seria legal se você reclamasse ou restringisse a atividade dessa pessoa, já que ele está mesmo ampliando e contribuindo de modo positivo com o seu trabalho comunicativo.

    O fato de que o site copiador tenha um melhor posicionamento no ranking não devia impedir você de melhorar também o seu conteúdo, atualizá-lo e reduzir a quantidade de material autopromocional e desnecessário que você mesmo faz ser duplicado por todas as páginas do seu site.

    Permita-me explicar isso direito.




    Quem Deveria Realmente Aparecer Primeiro nas SERPs?

    Naquele e-mail que mencionei no início do texto, o autor original reclamava que o seu conteúdo estava sendo ofuscado algumas vezes nas pesquisas por outros sites que o republicavam.

    Dei uma boa olhada em ambos os sites de modo profundo, buscando por esses conteúdos duplicados e o que acabei encontrando? A página do autor original pesava cerca de 60KB, mas quase 50% não era realmente parte do conteúdo relacionado ao artigo. Tratava-se apenas de um caminhão cheio de links que apontavam para outros artigos do mesmo autor e que tomavam mais espaço do artigo do que o próprio conteúdo em si.

    Do outro lado, estava o "copiador", quem não só havia se dado ao trabalho de escrever uma bela introdução, cheia de links adicionais e recursos relacionados e créditos e links claros redirecionando para o conteúdo original, mas tinha também juntado vários textos do autor original a fim de prover uma análise mais detalhada e abrangente do assunto. Além disso, o tamanho do conteúdo do artigo do "copiador" indexado pelo Google era três vezes maior que o artigo original e, quando se olhava com atenção, dava para perceber que o conteúdo relevante dominava o espaço do texto, deixando apenas as áreas mais à margem da navegação para os anúncios e outro tipo de informações.

    É por isso que o Google, ainda que soubesse bem quem tinha escrito o artigo primeiro e de onde ele vinha (já que o site que o duplicara não tinha feito disso um segredo, pelo contrário) preferiu mostrar numa posição superior do ranking o artigo "copiado".

    Em termos simples, o copiador estava fazendo um trabalho valioso, em todos os pontos de vista, ampliando o alcance e o valor do conteúdo original, além de dar o devido crédito e colocar links redirecionando a ele.

    O que o site original estava fazendo era lamentar a sua própria incapacidade de se manter nas primeiras posições do ranking dos buscadores sem a devida humildade para reconhecer o valor do conteúdo que fornece, tentar melhorá-lo e atualizá-lo de modo a torná-lo mais apreciado do que qualquer outro recurso disponível na rede sobre o assunto. O primeiro site também corria o risco de ignorar pontos importantes da questão, como o fato de que o outro site estava criando links e redirecionando tráfego para ele e devia se preocupar mais com o seu próprio aprimoramento e interesse dos seus usuários.

    O site "copiador" errou feio apenas em um quesito. Supondo que podia, até mesmo de forma tática, o site "copiador" errou quando se permitiu fazer muito sem se dar ao trabalho de pedir oficialmente a permissão do site original para duplicar o conteúdo que quisesse.

    Moral da história para os sites que duplicam conteúdo: A menos que você encontre um texto que diga claramente, sem deixar qualquer dúvida, algo como: "Fique à vontade para copiar o conteúdo do meu site..." (o que não é de todo raro de se encontrar - veja um bom exemplo no final desta página), é SEMPRE sua obrigação perder um pouco de tempo contactando o autor do conteúdo original e pedir sua permissão para a republicação do seu conteúdo. Ponto.




    O Conselho do Google

    Há mais medidas a tomar para abordar o tema do conteúdo duplicado e garantir que os visitantes vejam o conteúdo que você quer que vejam. (Lembre-se de novo que o Google está considerando MAIS a questão dos conteúdos duplicados dentro do SEU PRÓPRIO site, já que, com relação aos outros casos, o buscador sabe muito bem como lidar).

    • Ter conteúdo duplicado no site não serve de base para a tomada de medidas contra esse mesmo site, a menos que fique claro que a intenção de tal conteúdo duplicado seja a de enganar e manipular os resultados das pesquisas. Se o seu site tem problemas de conteúdo duplicado e você não se orientar pelos conselhos acima, sabemos escolher bem qual conteúdo deve ser exibido nas pesquisas.

      No entanto, se a nossa análise indicar que você usa de práticas fraudulentas e o seu site for removido dos nossos resultados, revise-o com cuidado. Se isso tiver acontecido, revise as nossas diretrizes para webmasters por mais informação. Quando você já tiver feito as mudanças necessárias e tenha certeza de que o seu site não esteja mais violando essas regras, submeta-o para uma reconsideração.

    • Não se aborreça tanto com sites que fazem ctrl C/ctrl V (ou seja, usam de maneira desapropriada e republicam) do seu conteúdo. Ainda que seja irritante, é muito improvável que estes sites consigam causar impacto negativo sobre a presença do seu site no Google. Se você encontrar um caso que seja particularmente ruim, você deve entrar com uma queixa DMCA, reivindicando a autoria do conteúdo e deixar que cuidemos nós mesmos do site.
    • Ainda assim, lembre-se que sempre mostraremos a versão (desbloqueada) que consideramos mais apropriada para os usuários em cada pesquisa, a qual pode não ser a versão que você queria.
    • Distribua com cautela: Se você distribui o seu conteúdo em outros sites, o Google sempre exibirá a versão que acha mais apropriada, não a sua preferida. No entanto, vale a pena certificar-se de que cada site em que você distribui os seus artigos exiba um link para o material original. Você também pode pedir a quem usa o seu material distribuido para bloquear a versão usada em seus sites através do comando robots.txt.
    • Depois disso, analise bem o seu próprio site:

    • Reduza a ocorrência de repetições desnecessárias: Por exemplo, em vez de incluir um texto grande sobre os direitos do autor no final de cada página, inclua um resumo breve e linke para a sua página para mais detalhes.
    • Reduza a incidência de conteúdo parecido: Se você tiver muitas páginas parecidas, pense em ampliar cada página ou consolidá-las de modo a formar uma só. Por exemplo, se você tem um site sobre viagens com páginas separadas para duas cidades, com a mesma informação em ambas páginas, o que poderia fazer é fundi-las em uma só ou expandir cada página para que forneça conteúdo único sobre cada uma das cidades.
    • Pense em bloquear algumas páginas para não serem indexadas: Em vez de permitir que os algoritmos do Google indiquem qual é a "melhor" versão do artigo, você pode nos guiar e mostrar a sua versão favorita. Por exemplo, se não quiser que o buscador indexe as versões para impressão dos seus artigos, desabilite estes diretórios ou lance mão de expressões comuns nesse caso através do arquivo robots.txt.
    • Use páginas de redirecionamento 301: Se você reestruturou o seu site, use páginas de redirecionamento 301 ("RedirectPermanent") no seu arquivo .htaccess para redirecionar de forma inteligente os usuários, o bot do Google e outros spiders. (Na linguagem Apache, você pode fazer isso com um arquivo .htaccess: na linguagem IIS, você pode fazer isso através do painel administrativo.)
    • Tenha consistência: Tente manter o seu sistema interno de links de maneira consistente. Por exemplo, não linke as páginas http://www.exemplo.com/pagina/ e http://www.exemplo.com/pagina e http://www.exemplo.com/pagina/index.htm.
    • Use domínios de nível: Para ajudar-nos a exibir a melhor versão de um documento, use domínios de nível sempre que possível para cuidar do conteúdo interno. É mais provável a gente saber que www.exemplo.de contém conteúdo focado na Alemanha, por exemplo, do que www.example.com/de ou de.example.com.
    • Use as Ferramentas para Webmaster para nos dizer como você prefere que o seu site seja indexado: Você pode indicar ao Google qual é o seu domínio preferido (por exemplo, www.exemplo.com ou http://exemplo.com).
    • Evite publicar stubs: Os usuários não gostam de ver páginas "vazias", portanto, evite usar tapas-buraco onde possível. Por exemplo, não publique páginas para as quais você ainda não tem conteúdo. Se você criá-las, use o arquivo robots.txt para impedir que sejam rastreadas.
    • Entenda o sistema de gerenciamento do seu conteúdo: Tenha a certeza de estar familiarizado com a forma com que o seu conteúdo é exibido no site. Blogs, fóruns e sistemas relacionados geralmente mostram o mesmo conteúdo em formatos variados. Por exemplo, um post de um blog pode aparecer na sua homepage, em uma página de arquivo, e na página de outros posts com a mesma etiqueta.

    (Fontes: Conselhos do Google para Conteúdos Duplicados

    Central Google para Webmasters

    artigo referente às diretrizes do Google para Conteúdo Duplicado)




    Mas, infelizmente, o Google não dá respostas às questões mais difíceis e polêmicas dos editores em relação ao assunto. Aqui estão algumas que ficaram sem resposta na Central Google para o webmaster:

    Kristen Veraldi commented... (5 de fevereiro de 2008)

    "Obrigado, Susan,

    Não poderia concordar mais com você - no universo dos conteúdos, TUDO se resume a agregar valor de forma temporal e relevante a partir da sua própria e única perspectiva.

    No entanto, para aqueles que realmente entendem isso e seguem com frequência o mantra de construir a partir da base, você acha que adicionar conteúdo genérico de terceiros a sua equação (digamos, 25% do tempo, por exemplo) pode manchar a reputação de um site?

    E se esse conteúdo terceirizado não se originar da rede (sem links originais, apenas o mesmo conteúdo em centenas de sites (ninguém sabe quem terá sido o primeiro) e foi fornecido apenas com o fim da distribuição em massa e reuso por algum tipo de área específica geradora de conteúdo.

    E se esses artigos realmente agregassem valor a sua esfera local (e.g., as pessoas que você conhece não estão necessariamente tentando se conectar através da pesquisa, mas aquelas que já te seguem sim)?

    Eu acho que o que estou perguntando é - se você não liga para a otimização desse conteúdo genérico e o valor é mais intrínseco, você ainda consegue oferecê-lo e se sentir relativamente cômodo em relação ao fato de que ele não prejudicará o seu conteúdo original nas pesquisas (partindo do ponto que nós nos importamos com a questão da indexação!).

    Esta é uma situação muito comum, por isso eu pergunto para todos que estão por aí, com sites exclusivos e que ficam imaginando se estão expostos a isso.

    Se isso fosse motivo para se preocupar, não poderia ser sanado através do uso de robôs com etiquetas nofollow nessas mesmas páginas contendo esse conteúdo que você não quer que seja copiado?

    Eu percebo que estas perguntas são quase impossíveis de se responder de modo definitivo - portanto, qualquer coisa que você quiser adicionar é muito bem-vinda. Obrigado!"

    ou
    Como foi escrito no Adwords (em 2 de março de 2008):

    "Tenho um diretório de artigos que é efetivamente feito de 100% de conteúdo duplicado (More Than Articles). Pouco tempo depois que ele começou, eu percebi uma queda no tráfego e descobri que todas as minhas páginas estavam no índice suplementar. Eu publico os artigos formatados em HTML e em texto puro, assim como a versão padrão. Portanto, basicamente, cada artigo aparece 3 vezes no site com poucas diferenças.

    Eu trabalhei mais uma vez em cima da navegação e do arquivo robots.txt para excluir tudo, menos a versão padrão da indexação. Isso tem levado ao retorno de todas as páginas ao índice principal e a um aumento gradual no tráfego.

    A partir dessa experiência, eu pude concluir que a duplicação dentro de um mesmo domínio é bem mais importante do que a duplicação feita em domínios diferentes."

    Portanto, na ausência de algumas respostas oficiais, aqui está o meu conselho definitivo em relação a conteúdos duplicados:




    O Conselho de Robin Good:



    Para aqueles que republicam conteúdo alheio:

    1. Peça pela permissão primeiro: Sempre
    2. Agregue valor - No mínimo: Adicione uma introdução e dê um título diferente
    3. Agregue valor - O melhor possível: Amplie, agregue valor adicional, fornecendo conteúdo relacionado, imagens, o seu próprio comentário e qualquer outra informação que adicione mais valor ao leitor final que busca por informação sobre o assunto
    4. Dê sempre o crédito por completo: Independente das regras ou requisitos que encontrar sobre qual é a melhor e mais correta maneira de linkar ao conteúdo original do artigo que você republicou por completo no seu site, deve-se vigiar o seguinte:

      a) crédito o nome do autor e o link para o seu perfil/bio online, quando disponível

      b) reconhecimento do site do autor, com o seu nome e link

      c) referência ao título do artigo original, data e primeira publicação, com links redirecionando para ele

    5. Declarar o tipo da licença original quando possível: Não deixe o autor original pensar ou supor de qualquer forma que você está aplicando a sua própria licença, seja ela Creative Commons ou Domínio Público ao copyright dele. Você não tem direito de fazer isso e ele tem todo o direito de ficar irritado.



    ... e para aqueles que tem tido o seu conteúdo republicado por outra pessoa:

    1. Desencane. Tentar manter o conteúdo no seu site não é vantagem para você na maioria das vezes. Se existem outros sites que querem de maneira honesta ampliar o alcance do seu conteúdo, agregando valor adicional a ele, deixe que o façam
    2. Reconheça o valor e a contribuição destes outros sites quando ampliam a visibilidade e alcance do seu conteúdo, ideias e autoria para um público maior, principalmente quando esses sites o fazem de forma justa e transparente dando crédito, reconhecimento e referência ao conteúdo original.
    3. Não se irrite automaticamente ao ver um site usando o seu conteúdo e não corra para a pesquisa do Google para ver os rankings. Não os culpe. Dê uma olhada no seu próprio site e pense em como melhorar o valor que fornece aos seus leitores, para que você não tenha concorrentes nessa área. Se o Google coloca um outro site em lugar mais alto que o seu, é porque alguma razão há.
    4. Acima de qualquer coisa, facilite o compartilhamento e a republicação do seu conteúdo em outros sites, através de feeds, widgets, e licenças abertas que declarem abertamente que você está na verdade a favor de permitir que o seu conteúdo vá aonde quiser, desde que seja dado o crédito correspondente, com o link direcionando a ele.



    Se o conteúdo for republicado com permissão, além de agregar o valor significativo que ele merece, deve-se mudar o seu título, adicionar uma introdução e dar o crédito/colocar o link para a fonte original, eu acho que tanto o autor original, assim como o site que republica se beneficiarão grandemente do fato. Mais pessoas lerão o conteúdo, mais pessoas conhecerão o site original e o autor e a mensagem será transmitida a um grupo maior de pessoas graças a esse serviço adicional de distribuição fornecida pelos buscadores com cópias adicionais que fornecerão valor extra ou complementar ao conteúdo original.

     

    Originalmente escrito por e publicado pela primeira vez na MasterNewMedia.

     

    Robin Good -
    Reference: Master New Media [ leia mais ]
     
    Comentários dos leitores    
    blog comments powered by Disqus

     

     


     

    Feed RSS de Notícias Diárias

     

     

    Curated by

    Publisher MasterNewMedia.org - New media explorer - Communication designer

     

     


    Real Time Web Analytics