Google indexando formulários

14 / 04 / 2008   google, seo* comente esse artigo

Está no blog oficial o Google agora indexa formulários. O artigo está comentado no SearchEngineLand.

Primeiro vamos ao que diz o Google.

Nos últimos meses temos explorado alguns formulários HTML na tentativa de descobrir novas páginas e URLs que, de outra forma, não econtraríamos e não seriam indexadas nas buscas dos usuários no Google. Especificamente, quando encontramos um elemento <FORM> em um site de alta qualidade, podemos decidir por realizar um pequeno número de queries utilizando o formulário. Para as caixas de texto nossos computadores automaticamente escolhem palavras do site; para menus select, checkbox e radio buttons no formulários, geramos e tentamos obter URLs que correspondam a possíveis entradas feitas por usuários. Se concluirmos que uma página resultante desse formulário é válida, interessante e inclui conteúdo que não consta em nossos índices, podemos inclui-lo  tanto quanto faríamos com qualquer outra página.

In the past few months we have been exploring some HTML forms to try to discover new web pages and URLs that we otherwise couldn’t find and index for users who search on Google. Specifically, when we encounter a <FORM> element on a high-quality site, we might choose to do a small number of queries using the form. For text boxes, our computers automatically choose words from the site that has the form; for select menus, check boxes, and radio buttons on the form, we choose from among the values of the HTML. Having chosen the values for each input, we generate and then try to crawl URLs that correspond to a possible query a user may have made. If we ascertain that the web page resulting from our query is valid, interesting, and includes content not in our index, we may include it in our index much as we would include any other web page.

O texto informa ainda que apenas formulários com método GET serão indexados e que valem as diretivas econtradas no robots.txt. Ou seja, se não quiser que um formulário seja indexado basta incluir algo como

# Não permita que os sites de busca indexem uma url
User-Agent: *
Disallow: /endereco/do/formulario

Como sempre, começam as dúvidas.
-Meu site está sendo indexado dessa forma? Hoje, provavelmente não, está lá que apenas alguns sites de “alta qualidade”, seja lá o que for isso na visão do Google, estão sendo testados.
-Há algum problema nisso? Apesar de estar escrito que o resultado será apenas indexado se ainda não constar da base do Google, há muita gente de qualidade preocupada com conteúdo duplicado na busca, o que poderia gerar uma punição para o site.

Eu enviei uma pergunta para o Google sobre a melhor forma de agir, se e quando responderem, eu atualizo aqui.

enviado por Marcos V.

Digg It! Digg It! Del.icio.us

Como é calculado o PageRank do Google?

29 / 04 / 2007   internet, programação, seo* 11 comentários

A artigo a seguir contém algumas explicações matemáticas, mas ao final dele ficará claro o conceito de PageRank.

O Google, e todos os outros sites de busca baseados em contexto, utilizam um ranqueamento de páginas. É isso, entre outras coisas, que faz uma página aparecer antes de outra nos resultados de uma busca. Como pode valer um bom dinheiro a posição na buscas, existe uma legião de SEOs (Search Engine Optimizers) à solta dizendo como fazer para melhorar o PageRank (PR daqui pra frente) de uma página. Mas afinal, como é calculado o PageRank do Google? leia mais…

enviado por Marcos V.

Digg It! Digg It! Del.icio.us

Se é pra atrair paraquedistas…

24 / 04 / 2007   seo, spam e splogs* 2 comentários

Se é pra atrair paraquedistas, pelo menos construa uma boa área de aterrisagem. Já deixei comentário no post dizendo que não fui convertido à  Santa Igreja Católica Paraquedista, mas que o post é muito bom, ahh isso é.

porqueveio.com/meme-todas-as-fotos-da-carol-carolini-carollini-do-bbb7-na-playboy-de-maio/

enviado por Marcos V.

Digg It! Digg It! Del.icio.us

A capa da Playboy, construção de galinheiros e a grande muralha da China.

18 / 04 / 2007   internet, seo* 1 comentário

Já vi em vários blogs (preciso deixar de ser preguiçoso e procurar os links pra adicionar aqui) artigos sobre paraquedismo virtual. Basicamente alguém escreve um texto um tanto fora do escopo do blog e acaba atraindo “desavisados”. Um exemplo clássico no Brasil é citar a modelo da última capa da Playboy -Essa torta de limão é tão gostosa quanto a Fulaninha da Silva da Playboy desse mês. Quem procurar por “fulaninha da Silva playboy” nos sites de busca, tem grande chance de cair na sua página. O objetivo disso é atrair um número maior de visitantes e, consequentemente, alguns cliques nos anúncios. Vou deixar pra outro artigo uma discussão se isso vale a pena do ponto de vista de monetização. O que queria discutir aqui é se funciona como instrumento de atração de visitantes.

Tem gente que é chocolátra, outros viciados em café. Eu sou fissurado em arquivos de log, aqueles que indicam o que cada usuário fez no site. Quais as páginas de entrada? Qual o caminho comum? Quanto tempo o visitante fica no site? Quais os termos utilizados nas buscas? São algumas das perguntas para as quais sempre quero resposta, pra qualquer site que administro. Pois bem, outro dia olhando nos logs do webcétera encontrei uns resultados curiosos. Recebi várias visitas sobre “construção de galinheiro” e mais ainda de gente procurando por “grande muralha da China”. Como dá pra perceber, são assuntos que não costumo tratar aqui no blog, mas que foram utilizados em exemplos. O primeiro aparece no post Blog, a missão, lá pelas tantas digo que “Pouco importa se o tema é criação de periquitos, construção de galinheiro ou política, defina sua missão e siga com ela”. Foi o suficiente.

No caso do paredão oriental, há um artigo chamado justamente “Grande muralha da China“, que indica como saber se o seu blog/site parou na censura digital chinesa. Um fato interessante é que, a certa altura, comento que “greatfirewallofchina.org, o nome é um trocadilho com grande muralha da china (great wall of china em inglês)“. Com isso chegaram muitas variações de busca. Desde “grande muralha da china” até “grande muralha da chine em inglês”. Vale a pena mencionar que em nenhuma dessas expressões o webcétera foi parar na primeira página das buscas, mas mesmo assim deu algum retorno.

Não posso dizer que isso gerou um aumento significativo de audiência, principalmente porque esses termos não estão entre os mais procurados. Na verdade, representou aproximadamente 1% dos visitantes do google nas respectivas semanas. Mas dá pra imaginar o resultado de estar na primeira página com cobinações de fulaninha da silva do panelão do Hugo na playbobo do mês.

Vale a pena investir no paraquedismo? Do ponto de vista de atrair visitantes sim, mas, se o seu site não for MUITO genérico, é melhor não, sob o risco de irritar seus visitantes habituais.

enviado por Marcos V.

Digg It! Digg It! Del.icio.us

Saiba como o Google vê o seu site/blog.

16 / 04 / 2007   Blog Design, internet, política, seo, spam e splogs* 1 comentário

Muita gente não sabe que o Google fornece uma série de ferramenta pra que o webmaster saiba como eles vêem cada site. Seguindo a lógica do nome “quanto mais direto, melhor”, as ferramentas são agregadas no serviço “Google Webmaster Tools“.

leia mais…

enviado por Marcos V.

Digg It! Digg It! Del.icio.us

Next Page »