More on this book
Community
Kindle Notes & Highlights
Contudo, durante entrevistas com clientes chineses, os gerentes-associados desanimaram-se ao ouvir como a empresa de Mountain View era vista entre os chineses: “A Baidu [concorrente local do Google] sabe mais [sobre a China] do que o Google”,
O curso dos eventos era desconcertante para Larry Page e Sergey Brin, os dois fundadores do Google. De todos os projetos da empresa, o que estava em questão na audiência – o Google Livros – talvez fosse o mais idealista. Tratava-se de uma audaciosa tentativa de digitalizar todos os livros já impressos para que qualquer pessoa no mundo pudesse encontrar as informações que procurasse.
O Google não disponibilizava o conteúdo completo das obras, de modo que, quando os leitores as descobrissem, teriam um motivo para comprá-las. Os autores teriam novos mercados; os leitores teriam acesso instantâneo ao conhecimento.
Page cresceu em Lansing, Michigan, onde seu pai era professor de Ciência da Computação na Michigan State. Seus pais se divorciaram quando ele tinha oito anos, mas Page manteve-se próximo de ambos. Como sua mãe também era formada em Ciência da Computação, esta área foi, naturalmente, sua primeira língua.
Page não era sociável (as pessoas que conversavam com ele costumavam se perguntar se ele não sofria de síndrome de Asperger) e podia irritar as pessoas pelo simples fato de não falar.
Na mesa de Page (e permeando suas conversas) estava o clássico de Donald Norman, guru de interface da Apple, The Psychology of Everyday Things, a bíblia da religião que tinha como primeiro (e aparentemente único) mandamento o princípio de que “O usuário está sempre certo”. (Outros discípulos de Norman, como Jeff Bezos, da Amazon.com, estavam adotando esse credo na web.)
Nikola Tesla, o brilhante cientista da Sérvia. Embora alguns afirmem que as contribuições de Tesla tenham sido tão importantes quanto as de Thomas Edison (e suas ambições tenham sido tão grandes a ponto de impressionar até mesmo Page), o cientista morreu na obscuridade. “Acho
Em 1995, esse espaço era a World Wide Web. A rede tinha saltado do cérebro inquieto de um (então) obscuro engenheiro britânico chamado Tim Berners-Lee, que trabalhava como técnico no CERN, laboratório de pesquisas físicas localizado na Suíça. Berners-Lee conseguia resumir sua visão em uma frase: “Suponha que todas as informações armazenadas nos computadores em todos os locais estejam conectadas […] Haveria um único espaço global de informações”.
Embora os primeiros websites fossem apenas instrumentos para a distribuição mais eficiente de trabalhos acadêmicos, logo as pessoas começaram a criar sites com todos os tipos de informações, ou simplesmente com o propósito deliberado de diversão.
Quando o usuário visualizava uma página, era possível ver, em geral destacado em azul, os ponteiros para os outros sites que o webmaster havia codificado na página – essa era a ideia de hipertexto que estimulava Bush, Nelson e Atkinson.
Page também buscava um tópico para sua dissertação e uma ideia apresentada a Winograd, uma colaboração com Brin, parecia mais promissora do que as demais: criar um sistema em que as pessoas conseguiriam fazer anotações e colocar comentários em sites. No entanto, quanto mais Page pensava sobre as anotações, mais bagunçadas as coisas pareciam ficar. Para sites grandes, é provável que houvesse muitas pessoas querendo fazer anotações em uma página. Como fazer para definir quem pode comentar ou qual comentário seria visto primeiro? Por esse motivo, Page afirmou: “Precisamos de um sistema de
...more
Apenas algoritmos – bem criados, eficientemente executados e com base em dados sólidos – poderiam gerar resultados imparciais.
Page entendia que os links na web eram como as citações em um artigo acadêmico. Era amplamente reconhecido que você poderia identificar quais trabalhos eram realmente importantes sem precisar lê-los, mas simplesmente somando quantos outros trabalhos os citavam nas notas e nas referências bibliográficas.
“Estava muito claro, para mim e para o restante do grupo, que, se encontrássemos uma forma de classificar as coisas com base não apenas na própria página, mas no que o mundo pensava da página, nossa pesquisa teria um valor considerável”, diz Page.
“Os grandões deviam ter algo como um milhão de páginas”, afirma Monier. Esse era o poder do AltaVista: sua extensão. Quando o DEC abriu os serviços para o público, em 15 de dezembro de 1995, quase 300 mil pessoas experimentaram o serviço. Elas ficaram deslumbradas.
“É tudo circular”, declarou Page posteriormente. “De certa forma, quão bom você é depende de quem se liga a você, e com quem você se liga determina quão bom você é. Tudo é um enorme círculo. Mas a matemática é ótima.
Você consegue resolver isso.” Os resultados do PageRank seriam combinados com uma
Há alguns milissegundos cruciais do processo de uma busca na internet durante os quais o sistema interpreta a palavra-chave e então acessa um vasto índice, onde todos os textos de bilhões de páginas estão
armazenados e organizados como no índice de um livro. Nesse
Em setembro de 1997, Page e Brin renomearam o BackRub para algo que esperavam se tornar mais adequado para os negócios. Eles consideraram seriamente o nome “The Whatbox” até que perceberam que era parecido demais com “wetbox”3, algo pornográfico demais. Então, o colega de quarto de Page sugeriu que eles chamassem a ferramenta de “googol”. A palavra era um termo matemático que se referia ao número 1 seguido por cem zeros. Às vezes, a palavra “googolplex” era usada de forma genérica para se referir a um número extremamente grande. “O número refletia a escala do que estávamos fazendo”, explicou
...more
Page posteriormente acharia engraçado o fato de as pessoas elogiarem o design pelo uso do espaço branco de uma forma ‘Zen’. “O minimalismo está no fato de que não tínhamos um webmaster e tivemos que construir o site nós mesmos”, diz Page.
Uma concessão que o Yahoo! ofereceu ao Google se tornou decisiva: na página de resultados das pesquisas do Yahoo!, o usuário veria uma mensagem apontando que a pesquisa era realizada pelo Google. A página até mesmo tinha o logo do Google. Assim, milhões de usuários do Yahoo! descobriram um novo destino
de buscas que se tornaria parte de suas vidas.
“Isso aumentou o tráfego em algo como cinquenta por cento em dois meses”, lembra Manber sobre a mudança para o Google. Porém, os únicos comentários que ele recebeu dos executivos do Yahoo! eram reclamações de que as pessoas estavam fazendo muitas buscas e que, portanto, a empresa teria de pagar taxas mais altas para o Google.
Entretanto, o dinheiro que o Google recebia por realizar pesquisas não era o maior benefício. Ainda mais valioso era o fato de que agora a empresa tinha acesso a muito mais usuários e a muito mais dados.
O comportamento de pesquisa dos usuários, capturado e encapsulado em logs que podiam ser analisados e explorados, transformariam o Go...
This highlight has been truncated due to consecutive passage length restrictions.
Patel percebeu, por exemplo, que as buscas por perguntas de lição de casa aumentavam substancialmente nos finais de semana. “As pessoas esperavam até a noite de domingo para fazer suas lições, e então faziam buscas no Google”, ele comenta. Ao rastrear quais buscas eram feitas, ele também podia vislumbrar em tempo real em quais assuntos uma parte específica do mundo estava interessada. (Alguns
Aqueles logs contavam histórias. Não apenas quando ou como as pessoas usavam o Google, mas que tipo de pessoa esses usuários eram e como eles pensavam. Patel percebeu que os logs podiam fazer o Google mais inteligente e, então, compartilhou as informações contidas nesses logs com engenheiros de busca como Jeff Dean e Krishna Bharat, que estavam verdadeiramente
O “long click” indicava que o Google havia fornecido resultados satisfatórios. Todavia, os usuários insatisfeitos eram insatisfeitos de um modo bastante característico. O fator mais notável era os “short clicks”, em que um usuário seguia um link e imediatamente voltava para tentar outra vez. “Se as pessoas digitavam algo e então voltavam e mudavam a pesquisa, pode-se dizer que elas não estavam satisfeitas”, comenta Patel. “Se elas vão para a segunda página de resultados, isso é um sinal de que não estão satisfeitas. Você pode ver esses sinais de que alguém não está satisfeito com o que
...more
“Descobrimos muito cedo uma coisa interessante”, relata Amit Singhal, engenheiro de busca, que trabalhou de perto com os sinônimos. “As pessoas trocam as palavras em suas buscas. Então, alguém diria ‘Fotos de cachorros’ e, depois, ‘Fotos de filhotes’. Isso significa que talvez ‘cachorros’ e ‘filhotes’ fossem intercambiáveis. Também descobrimos que, quando você ferve a água, é água quente. Aprendemos a semântica com os humanos, e isso foi um enorme avanço.”
Da mesma forma, ao analisar como as pessoas corrigiam seus passos após escrever uma palavra com erro de ortografia, o Google desenvolveu seu próprio verificador ortográfico. A empresa inseriu esse conhecimento em seu sistema. Se o usuário digitasse incorretamente uma palavra, ainda
assim o Google lhe retornaria os resulta...
This highlight has been truncated due to consecutive passage length restrictions.
que usava as teorias de Ludwig Wittgenstein sobre como as palavras são definidas pelo contexto.
“Cachorro-quente” seria encontrado em pesquisas que também continham “pão” e “mostarda” e “jogos de beisebol” – não em “filhotes com pelos queimados”.
Por melhor que o Google fosse, a ferramenta de busca ainda tropeçava com os nomes. Isso impulsionou um esforço de muitos anos, realizado por Singhal e sua equipe, para produzir um sistema de detecção de nomes dentro da ferramenta de pesquisa. Os nomes eram importantes. Apenas oito por cento das consultas no Google envolviam nomes – e metade dessas pesquisas era por nomes de celebridades. Além disso, as consultas por nomes menos conhecidos eram casos em que o usuário tinha necessidades específicas (incluindo as “pesquisas narcisistas”, em que as pessoas procuram seus próprios nomes no Google –
...more
“Tínhamos um computador aprendendo algoritmo, e nele construímos nosso classificador de nomes.”
ou seja, como uma ferramenta de busca poderia analisar uma série de palavras inseridas no campo de busca e fazer o tipo de distinção que um humano inteligente faria?
Por exemplo, “New York” representa duas palavras que aparecem juntas (em outras palavras, é um bigrama). No entanto, o mesmo se aplica às três palavras “New York Times”, que claramente indicam um tipo diferente de busca. Tudo muda quando a consulta é feita por “New York Times Square”, e, nesse caso, uma quebra aconteceria em… bem, você sabe
Livrar-se da pornografia indesejada sempre foi uma prioridade para o Google. A primeira tentativa da empresa foi construir uma lista de aproximadamente 5 mil palavras de cunho pornográfico.
Os maiores sites pornográficos aceitavam isso bem. Eles sabiam que seria ruim para eles se um usuário tropeçasse e caísse acidentalmente em uma dessas casas do pecado. Isso poderia torná-los um alvo dos sensacionalistas e dos legisladores à procura de publicidade. No entanto, nem todos os sites agiam como bons cidadãos. Cutts percebeu que uma página de pornografia usava alguns métodos bastante inteligentes para enganar o sistema de bloqueio do Google e aparecer entre as primeiras opções de resultado. “Foi um momento revelador”, confessa Cutts. “O PageRank e a análise de links podiam ser
...more
“otimização para mecanismos de busca”,
SEO (do inglês Search Engine Optimization).
O site do hotel procurado não aparecia na primeira página. Em vez disso, os principais resultados seriam dominados por empresas especializadas em realizar reservas...
This highlight has been truncated due to consecutive passage length restrictions.
SearchKing processou o Google depois que uma desagradável noite na “Dança do Google” fez seu PageRank cair de oito para quatro e seus negócios fracassarem. (Em maio de 2003, um juiz arquivou o processo, afirmando que o PageRank é essencialmente uma opinião sobre um site – embora seja uma opinião expressa por algoritmos – e, portanto, constitucionalmente protegido.)
Usando o pseudônimo de “Google Guy”, ele respondia a perguntas e tentava, o máximo que podia, dissipar várias teorias da conspiração, muitas delas em torno da suspeita de que uma das melhores formas de chegar ao topo dos resultados era comprar anúncios no Google.
O Google não disse simplesmente ‘Esse é o estado da arte, isso é o que os manuais dizem, vamos fazer igual’. Não, a equipe desenvolvia coisas do zero e fazia isso da melhor forma possível.”
Manber também ficou impressionado com a quantidade de mimos que os funcionários recebiam. Cada engenheiro tinha um conjunto exclusivo de servidores que armazenavam um índex de toda a web – o que era o equivalente a dar a um físico seu próprio acelerador de partículas.
Um grande desafio da Busca Universal era como determinar o valor relativo da informação quando ela viesse de lugares diferentes. O Google tinha se saído bem ao descobrir como ranquear websites em uma determinada consulta e tinha aprendido bastante sobre como organizar o corpus de resultados de imagens e vídeos de modo a satisfazer as exigências da pesquisa. Cada corpus possuía uma mistura de sinais diferentes. (Tudo na web, é claro, tinha o benefício de linkar informação, mas coisas como vídeos não apresentavam um equivalente.)
“Poderia haver informações na busca que nos dissessem que um resultado de uma notícia era realmente relevante e de extrema importância”. Entretanto, a solução envolvia claramente decodificar a intenção da consulta.
Norvig sentia que seria absurdo ter uma divisão separada no Google que fosse especializada em coisas como aprendizagem de máquina – em vez disso, a inteligência artificial devia espalhar-se