Início » Sales & Marketing » O estado atual do Google PageRank e como ele evoluiu

O estado atual do Google PageRank e como ele evoluiu

google-pagerank

PageRank (PR) é um algoritmo que melhora a qualidade dos resultados da pesquisa usando links para medir a importância de uma página. Ele considera links como votos, com a suposição subjacente de que páginas mais importantes provavelmente receberão mais links.

O PageRank foi criado pelos cofundadores do Google, Sergey Brin e Larry Page, em 1997, quando eles estavam na Universidade de Stanford, e o nome é uma referência a Larry Page e ao termo “página da web”. 

De muitas maneiras, é semelhante a uma métrica chamada “fator de impacto” para periódicos, onde mais citado = mais importante. É um pouco diferente porque o PageRank considera alguns votos mais importantes do que outros. 

Ao usar links junto com o conteúdo para classificar as páginas, os resultados do Google foram melhores que os dos concorrentes. Os links se tornaram a moeda da web.

Quer saber mais sobre o PageRank? Vamos mergulhar.

Conteúdo
Google ainda usa PageRank
Matemática divertida, por que a fórmula do PageRank estava errada
Histórico do PageRank
Como o PageRank mudou
Você ainda pode verificar seu PageRank?
Como melhorar seu PageRank
Considerações finais

Google ainda usa PageRank

Em termos de SEO moderno, o PageRank é um dos algoritmos que compõem Experiência Expertise Autoridade Confiabilidade (EEAT).

Os algoritmos do Google identificam sinais sobre páginas que se correlacionam com confiabilidade e autoridade. O mais conhecido desses sinais é o PageRank, que usa links na web para entender a autoridade.

Fonte: Como o Google combate a desinformação

Também recebemos a confirmação de representantes do Google, como Gary Illyes, que disse que o Google ainda usa o PageRank e que os links são usados ​​para o EAT (agora EEAT).

Quando eu corri um estudo para medir o impacto dos links e removeu efetivamente os links usando a ferramenta de rejeição, a queda foi óbvia. Os links ainda são importantes para as classificações.

Impacto no tráfego quando os links são rejeitados

PageRank também tem sido um fator confirmado quando se trata de orçamento de rastreamento. Faz sentido que o Google queira rastrear páginas importantes com mais frequência.

PageRank também é um sinal de canonização. As páginas com um PageRank mais alto têm maior probabilidade de serem escolhidas como a versão canônica que é indexada e exibida aos usuários.

Matemática divertida, por que a fórmula do PageRank estava errada 

Fato louco: a fórmula publicada no artigo original do PageRank estava errada. Vejamos o porquê. 

PageRank foi descrito em o papel original como uma distribuição de probabilidade - ou a probabilidade de você estar em qualquer página da web. Isso significa que, se você somar o PageRank de todas as páginas da Web, deverá obter um total de 1.

Aqui está a fórmula completa do PageRank do artigo original publicado em 1997:

PR (A) = (1-d) + d (PR (T1) / C (T1) +… + PR (Tn) / C (Tn))

Simplificando um pouco e assumindo que o fator de amortecimento (d) é 0.85 como o Google mencionou no artigo (explicarei o que é o fator de amortecimento em breve), é:

PageRank para uma página = 0.15 + 0.85 (uma parte do PageRank de cada página de link dividida em seus links de saída)

No jornal, eles diziam que a soma do PageRank para cada página deveria ser igual a 1. Mas isso não é possível se você usar a fórmula do jornal. Cada página teria um PageRank mínimo de 0.15 (1-d). Apenas algumas páginas colocariam o total em mais de 1. Você não pode ter uma probabilidade maior que 100%. Algo está errado!

A fórmula deve realmente dividir isso (1-d) pelo número de páginas na internet para que funcione conforme descrito. Seria:

PageRank para uma página = (0.15/número de páginas na internet) + 0.85 (uma parte do PageRank de cada página de link dividida em seus links de saída)

Ainda é complicado, então vamos ver se consigo explicar com alguns recursos visuais.

1. Uma página recebe uma pontuação inicial do PageRank com base nos links que apontam para ela. Digamos que eu tenha cinco páginas sem links. Cada um recebe um PageRank de (1/5) ou 0.2.

Exemplo de PageRank de cinco páginas ainda sem links

2. Essa pontuação é então distribuída para outras páginas através dos links na página. Se eu adicionar alguns links às cinco páginas acima e calcular o novo PageRank para cada uma, terminarei com isso: 

Exemplo de PageRank de cinco páginas após uma iteração

Você notará que as pontuações estão favorecendo as páginas com mais links para elas.

3. Esse cálculo é repetido conforme o Google rastreia a web. Se eu calcular o PageRank novamente (chamado de iteração), você verá que as pontuações mudam. São as mesmas páginas com os mesmos links, mas o PageRank base de cada página mudou, então o PageRank resultante é diferente.

Exemplo de PageRank de cinco páginas após duas iterações

A fórmula PageRank também tem o chamado “fator de amortecimento”, o “d” na fórmula, que simula a probabilidade de um usuário aleatório continuar a clicar em links enquanto navega na web. 

Pense assim: a probabilidade de você clicar em um link na primeira página que você visita é razoavelmente alta. Mas a probabilidade de você clicar em um link na próxima página é um pouco menor e assim por diante.

Se uma página forte for vinculada diretamente a outra página, ela passará muito valor. Se o link estiver a quatro cliques de distância, o valor transferido dessa página forte será muito menor por causa do fator de amortecimento.

Exemplo mostrando o fator de atenuação do PageRank

Histórico do PageRank

Histórico do PageRank

A primeira patente do PageRank foi registrada em 9 de janeiro de 1998. Foi intitulada “Método para classificação de nós em um banco de dados vinculado. " Esta patente expirou em 9 de janeiro de 2018 e não foi renovada. 

O Google tornou o PageRank público pela primeira vez quando o Google Directory lançado em 15 de março de 2000. Esta era uma versão do Open Directory Project, mas classificada por PageRank. O diretório foi fechado em 25 de julho de 2011.

Era 11 de dezembro de 2000, quando O Google lançou o PageRank na barra de ferramentas do Google, que era a versão mais obcecada pelos SEOs.

Era assim que parecia quando o PageRank foi incluído na barra de ferramentas do Google. 

PageRank 8/10 na antiga barra de ferramentas do Google

O PageRank na barra de ferramentas foi atualizado pela última vez em 6 de dezembro de 2013 e finalmente removido em 7 de março de 2016.

O PageRank mostrado na barra de ferramentas era um pouco diferente. Ele usou um sistema de numeração simples de 0 a 10 para representar o PageRank. Mas o próprio PageRank é uma escala logarítmica em que alcançar cada número mais alto se torna cada vez mais difícil.

O PageRank chegou até os Sitemaps do Google (agora conhecido como Google Search Console) em 17 de novembro de 2005. Foi exibido nas categorias alto, médio, baixo ou N/A. Este recurso foi removido em 15 de outubro de 2009.

Ao longo dos anos, houve várias maneiras diferentes pelas quais os SEOs abusaram do sistema na busca por mais PageRank e melhores classificações. O Google tem um todo lista de esquemas de links que inclui:

  • Compra ou venda de links — troca de links por dinheiro, mercadorias, produtos ou serviços.
  • Trocas excessivas de links.
  • Usando software para criar links automaticamente.
  • Exigir links como parte de termos de serviço, contrato ou outro acordo.
  • Anúncios de texto que não usam atributos nofollow ou patrocinados.
  • Publicitários ou publicidade nativa que incluem links que passam o crédito de classificação.
  • Artigos, postagens de convidados ou blogs com links de texto âncora otimizados.
  • Diretórios de baixa qualidade ou links de favoritos sociais.
  • Links ricos em palavras-chave, ocultos ou de baixa qualidade incorporados em widgets que são colocados em outros sites.
  • Links amplamente distribuídos em rodapés ou templates. Por exemplo, codificar um link para o seu site no WP Theme que você vende ou distribui gratuitamente.
  • Comentários do fórum com links otimizados na postagem ou na assinatura.

Os sistemas de combate ao spam de links evoluíram ao longo dos anos. Vejamos algumas das principais atualizações.

Não siga

Em 18 de janeiro de 2005, o Google anunciou que havia feito parceria com outros grandes mecanismos de busca para introduza o atributo rel=“nofollow”. Ele encorajou os usuários a adicionar o não siga atributo aos comentários do blog, trackbacks e listas de referenciadores para ajudar a combater o spam.

Aqui está um trecho da declaração oficial do Google sobre a introdução do nofollow:

Se você é um blogueiro (ou um leitor de blog), está dolorosamente familiarizado com pessoas que tentam aumentar a classificação dos mecanismos de pesquisa de seus próprios sites enviando comentários de blog vinculados como "Visite meu site de produtos farmacêuticos com desconto". Isso se chama spam de comentários, também não gostamos e estamos testando uma nova tag que o bloqueia. A partir de agora, quando o Google vir o atributo (rel=“nofollow”) nos hiperlinks, esses links não receberão nenhum crédito quando classificarmos os sites em nossos resultados de pesquisa. 

Quase todos os sistemas modernos usam o atributo nofollow nos links de comentários do blog. 

Os SEOs até começaram a abusar do nofollow – porque é claro que sim. Nofollow foi usado para escultura de PageRank, onde as pessoas iriam nofollow alguns links em suas páginas para tornar outros links mais fortes. O Google acabou mudando o sistema para evitar esse abuso.

Em 2009, Matt Cutts do Google confirmou que isso não funcionaria mais e que o PageRank seria distribuído entre os links mesmo se um atributo nofollow estivesse presente (mas apenas passado pelo link seguido).

Google adicionado mais alguns atributos de link que são versões mais específicas do atributo nofollow em 10 de setembro de 2019. Isso inclui rel=“ugc” para identificar o conteúdo gerado pelo usuário e rel=“patrocinado” para identificar links pagos ou afiliados.

Como os SEOs encontraram novas maneiras de criar links, o Google trabalhou em novos algoritmos para detectar esse spam. 

Quando o algoritmo original do Penguin foi lançado em 24 de abril de 2012, prejudicou muitos sites e proprietários de sites. O Google deu aos proprietários de sites uma maneira de se recuperar no final daquele ano, introduzindo o ferramenta de rejeição em outubro 16, 2012.

Quando pinguim 4.0 lançado em 23 de setembro de 2016, ele trouxe uma mudança bem-vinda em como o spam de links era tratado pelo Google. Em vez de prejudicar os sites, começou a desvalorizar os links de spam. Isso também significava que a maioria dos sites não precisava mais usar a ferramenta de rejeição. 

Google lançou seu primeiro Atualização de spam de links em 26 de julho de 2021. Isso evoluiu recentemente e um Atualização de spam de links em 14 de dezembro de 2022, anunciou o uso de um sistema de detecção baseado em IA chamado SpamBrain para neutralizar o valor de links não naturais. 

Como o PageRank mudou

A versão original do PageRank não é usada desde 2006, de acordo com um ex-funcionário do Google. O funcionário disse que foi substituído por outro algoritmo menos intensivo em recursos.

Eles o substituíram em 2006 por um algoritmo que fornece resultados aproximadamente semelhantes, mas é significativamente mais rápido de calcular. O algoritmo de substituição é o número informado na barra de ferramentas e o que o Google reivindica como PageRank (tem até um nome semelhante e, portanto, a afirmação do Google não é tecnicamente incorreta). Ambos os algoritmos são O(N log N) mas a substituição tem uma constante muito menor no fator log N, pois elimina a necessidade de iterar até que o algoritmo convirja. Isso é bastante importante, pois a web cresceu de aproximadamente 1 a 10 milhões de páginas para mais de 150 bilhões.

Você se lembra dessas iterações e de como o PageRank mudava a cada iteração? Parece que o Google simplificou esse sistema.

O que mais mudou?

Em vez de dividir o PageRank igualmente entre todos os links em uma página, alguns links são mais valorizados do que outros. Há especulações de patentes de que o Google mudou de um modelo de surfista aleatório (onde um usuário pode acessar qualquer link) para um modelo de surfista razoável (onde alguns links são mais propensos a serem clicados do que outros, então eles carregam mais peso).

Vários sistemas foram implementados para ignorar o valor de certos links. Já falamos sobre alguns deles, incluindo:

  • Nofollow, UGC e atributos patrocinados.
  • Algoritmo do pinguim do Google.
  • A ferramenta de rejeição.
  • Atualizações de spam de links.

O Google também não contará links em páginas bloqueadas por robots.txt. Não será possível rastrear essas páginas para ver nenhum dos links. Este sistema provavelmente estava em vigor desde o início.

Google tem um canonização sistema que o ajuda a determinar qual versão de uma página deve ser indexada e a consolidar sinais de páginas duplicadas para essa versão principal.

Sinais de canonização

Elementos de link canônico foram introduzidos em 12 de fevereiro de 2009 e permitem que os usuários especifiquem sua versão preferida.

Originalmente, dizia-se que os redirecionamentos passavam a mesma quantidade de PageRank que um link. Mas, em algum momento, esse sistema mudou e nenhum PageRank foi perdido no momento.

Um pouco ainda é desconhecido

Quando as páginas são marcadas como noindex, não sabemos exatamente como o Google trata os links. Mesmo os Googlers têm declarações conflitantes.

Segundo John Müller, as páginas marcadas como noindex serão eventualmente tratadas como noindex, nofollow. Isso significa que os links eventualmente param de passar qualquer valor.

De acordo com Gary, O Googlebot descobrirá e seguirá os links, desde que uma página ainda tenha links para ela.

Estes não são necessariamente contraditórios. Mas se você seguir a declaração de Gary, pode levar muito tempo até que o Google pare de rastrear e contar links – talvez nunca.

Você ainda pode verificar seu PageRank?

No momento, não há como ver o PageRank do Google.

Classificação de URL (UR) é uma boa métrica substituta para o PageRank porque tem muito em comum com a fórmula do PageRank. Ele mostra a força do perfil de link de uma página em uma escala de 100 pontos. Quanto maior o número, mais forte o perfil do link.

Captura de tela mostrando a pontuação UR da visão geral do Ahrefs 2.0

Tanto o PageRank quanto o UR consideram links internos e externos ao serem calculados. Muitas das outras métricas de força usadas na indústria ignoram completamente os links internos. Eu diria que os construtores de links deveriam olhar mais para UR do que para métricas como DR, que só considera links de outros sites.

No entanto, não é exatamente o mesmo. UR ignora o valor de alguns links e não conta links nofollow. Não sabemos exatamente quais links o Google ignora e não sabemos quais links os usuários podem ter rejeitado, o que afetará o cálculo do PageRank do Google. Também podemos tomar decisões diferentes sobre como tratamos alguns dos sinais de canonização, como elementos de link canônico e redirecionamentos.

Portanto, nosso conselho é usá-lo, mas saiba que pode não ser exatamente como o sistema do Google.

Temos também Classificação da página (PR) in Auditoria do local Explorador de páginas. Isso é semelhante a um cálculo de PageRank interno e pode ser útil para ver quais são as páginas mais fortes em seu site com base em sua estrutura de links internos.

Classificação da página na auditoria do site da Ahrefs

Como melhorar seu PageRank

Como o PageRank é baseado em links, para aumentar seu PageRank, você precisa de links melhores. Vejamos suas opções.

Redirecionar páginas quebradas

Redirecionar páginas antigas em seu site para novas páginas relevantes pode ajudar a recuperar e consolidar sinais como o PageRank. Os sites mudam com o tempo e as pessoas parecem não gostar de implementar redirecionamentos adequados. Esta pode ser a vitória mais fácil, pois esses links já apontam para você, mas atualmente não contam para você.

Veja como encontrar essas oportunidades:

Normalmente, classifico isso por "Domínios de referência".

Melhor relatório por links filtrado para o código de status 404 para mostrar as páginas que você pode querer redirecionar

Pegue essas páginas e redirecione-as para as páginas atuais do seu site. Se você não sabe exatamente para onde eles vão ou não tem tempo, tenho um script de redirecionamento automatizado isso pode ajudar. Ele examina o conteúdo antigo do archive.org e o compara com o conteúdo atual mais próximo do seu site. É aqui que você provavelmente deseja redirecionar as páginas.

Os backlinks nem sempre estão sob seu controle. As pessoas podem criar links para qualquer página em seu site que escolherem e podem usar qualquer texto âncora que desejarem.

Os links internos são diferentes. Você tem controle total sobre eles.

Vincule internamente onde fizer sentido. Por exemplo, você pode querer vincular mais páginas que são mais importantes para você.

Temos uma ferramenta dentro Auditoria do site chamado Oportunidades de links internos que o ajuda a localizar rapidamente essas oportunidades. 

Essa ferramenta funciona procurando menções de palavras-chave para as quais você já classifica em seu site. Em seguida, sugere-os como oportunidades contextuais de links internos.

Por exemplo, a ferramenta mostra uma menção de “navegação facetada” em nosso guia para conteúdo duplicado. Como o Site Audit sabe, temos uma página sobre navegação facetada, ele sugere que adicionemos um link interno a essa página.

Exemplo de uma oportunidade de link interno

Você também pode obter mais links de outros sites para o seu próprio para aumentar seu PageRank. Já temos muitos guias sobre criação de links. Alguns dos meus favoritos são:

Considerações finais

Embora o PageRank tenha mudado, sabemos que o Google ainda o utiliza. Podemos não conhecer todos os detalhes ou tudo o que está envolvido, mas ainda assim é fácil ver o impacto dos links.

Além disso, o Google simplesmente não consegue fugir do uso de links e PageRank. Certa vez, ele experimentou não usar links em seu algoritmo e decidiu contra isso.

Portanto, não temos uma versão como essa exposta ao público, mas temos nossos próprios experimentos internos e a qualidade parece muito, muito pior. Acontece que os backlinks, mesmo que haja algum ruído e certamente muito spam, na maioria das vezes ainda são uma grande vitória em termos de qualidade dos resultados da pesquisa.

Brincamos com a ideia de desativar a relevância do backlink e, pelo menos por enquanto, a relevância dos backlinks ainda ajuda muito em termos de garantir que tenhamos o melhor, mais relevante e mais tópico conjunto de resultados de pesquisa.

Fonte: YouTube (Central de Pesquisa do Google)

Retirado de Ahrefs

Isenção de responsabilidade: as informações apresentadas acima são fornecidas pela Ahrefs independentemente do Alibaba.com. Alibaba.com não faz nenhuma representação e garantia quanto à qualidade e confiabilidade do vendedor e dos produtos.

Esse artigo foi útil?

Sobre o autor

Deixe um comentário

O seu endereço de e-mail não será publicado. Os campos obrigatórios são marcados com *

Voltar ao Topo