Sites de Busca
Básico
Google
Yahoo!
msn
dmoz
Outras SEs
Mais Info
|
Google PageRank
Para se compreender o que é, e qual a importância do Pagerank, é necessário recordar um pouco da luta entre Search Engines e spammers que vem sendo travada desde que a internet tornou-se comercial.
Já se tornara evidente que (as SERPs mostravam isso), se se deixasse a cargo dos webmasters a tarefa de determinar qual o assunto abordado nas páginas (ou seja, se o ranking fosse determinado apenas por fatores on page - da própria página), os spammers facilmente dominariam os resultados. A Altavista introduziu o conceito de link popularity, pelo qual a avaliação de uma página passaria a levar em conta também fatores off page: quanto mais links apontassem para uma determinada página, melhor seria sua pontuação; os spammers logo descobriram uma brecha: eles se reuniam em grupos, criavam links entre si, e inflavam artificialmente a popularidade de suas páginas.
A Google levou adiante a idéia de que fatores off page deveriam determinar a importância de uma página. Mas, em vez de contar tão somente o número de links (que pode ser facilmente inflado) como fez a Altavista, a Google teve a idéia de atribuir diferentes pesos a cada link; a importância de cada link seria proporcional à importância da página em que o link estivesse inserido; e a importância da página seria proporcional à quantidade e importância dos links que ela recebesse.
A esse índice de importância de cada página foi dado o nome de PageRank, em homenagem a Larry Page, autor da idéia.
Clique o link para ler o paper original sobre PageRank, em formato PDF. Veja mais comentários sobre o paper na seção Fundamentos Matemáticos do PageRank.
O único fator que aumenta o PageRank de uma página são os links que apontam para ela, bem como o PageRank da página que contém o link; de acordo com a fórmula original, o PageRank de uma página é, após um desconto (se uma página tem 100 pontos de PageRank, apenas, digamos, 85 poderiam ser repassados), dividido igualmente entre todas as páginas linkadas na página.
Observe que uma página não perde seu PageRank, independente de quantos links contenha. O PageRank pode ser comparado a uma "capacidade de voto": quanto maior o PR de uma página, mais PR ela pode passar (maior será o PR das páginas linkadas); essa "capacidade de voto" é conquistada, ela também, por meio de votações de outros sites: a única maneira de se incrementar o próprio PR é conseguindo contribuições de PRs de outros sites.
Note que o cálculo de PageRank é recursivo: para saber meu PR, eu tenho que saber o PR das páginas que linkam para mim; mas o PR dessas outras páginas depende do meu próprio PR, já que eu posso ter links diretos ou indiretos para elas. O cálculo do PageRank é extremamente trabalhoso; leia mais sobre o cálculo do PageRank no link acima indicado de Fundamentos Matemáticos do PageRank.
A importância do PR decorre de sua aplicação (e por muito tempo somente a Google pôde fazer isso) no rankeamento de páginas. Comparemos as situações:
Antes do PR: para uma pesquisa por [palavra], a SE selecionava mil páginas que contivessem [palavra]; a SE levava então em conta fatores on page, tais como presença da palavra no título, presença da palavra em headers, contagem do número de palavras na página, posição das palavras no texto, etc., e atribuía a cada página uma pontuação. No caso da Altavista, essa pontuação poderia ser corrigida por um fator proporcional à link popularity, mas, como vimos, com o tempo esse fator tornou-se manipulável. Ao fim desse cálculo, a SE retornava para o usário aquelas mil páginas, em ordem decrescente de pontuação.
Com o PR: para a mesma pesquisa por [palavra], a Google, por hipótese, selecionaria as mesmas mil páginas (na prática, isso não ocorre); aplicaria os mesmos critérios para obter pontuações on page. A diferença é que essas pontuações seriam ao final corrigidas pelo PageRank: uma página de alto PageRank (ou seja, de alto conceito dentro da web) poderia ultrapassar várias outras que tivessem uma pontuação maior.
Obviamente, esse ordenamento depende de muitos outros fatores (no caso da Google, é certo que os textos âncoras apontando para as páginas têm grande peso no ordenamento); é óbvio também que a Google pode alterar os pesos dos fatores (inclusive e principalmente o peso do PageRank) conforme achar conveniente.
O fato é que o PageRank foi o principal fator do sucesso da Google. A Google tornou-se o que é hoje porque seus resultados agradavam os usuários; agradavam porque eram mais relevantes; e eram mais relevantes muito por causa do PageRank. Embora tenha certamente passado por muitos ajustes, até hoje, segundo a própria Google, "the heart of our software is PageRank" (o coração do software da Google é o PageRank).
|
|