Concrete Logo
Hamburger button

Testinho 10

  • Blog
  • 21 de Setembro de 2012
Share

Resposta do testinho 9

O povo anda muito esperto. O testinho 9 foi resolvido corretamente aqui dentro da Concrete pouco segundos depois que postei. Nem deixei o Victor Nascimento responder nos comentários para não estragar a brincadeira. Mas a resposta certa chegou rapidinho. O Fernando Meirelles acertou e o Renne Rocha matou a cobra e mostrou o pau.

O mais legal deste chamado problema de Monty Hall foi a polêmica que suscitou na época.

Em setembro de 1991, a famosa coluna Ask Marilyn do jornal Parade, rebebeu esta pergunta. A coluna era escrita pela Marilyn Vos Savant. Ela respondia perguntas graças a fama por seu QI 228 medido em 1956 e que por muitos anos figurou como recorde no Guinness.

A resposta dela desagradadou muita gente, incluindo professores universitários com Ph.D., tal como mostra o PDF da cópia da página do jornal.

Vejam alguns comentários que chegaram à coluna (no PDF citado) e que tirei de marilynvossavant.com/game-show-problem:

    “… As a professional mathematician, I’m very concerned with the general public’s lack of mathematical skills. Please help by confessing your error and in the future being more careful. Robert Sachs, Ph.D. George Mason University”
    “… There is enough mathematical illiteracy in this country, and we don’t need the world’s highest IQ propagating more. Shame! Scott Smith, Ph.D. University of Florida”
    “You’re in error, but Albert Einstein earned a dearer place in the hearts of people after he admitted his errors. Frank Rose, Ph.D. University of Michigan”
    “…your answer is clearly at odds with the truth. James Rauff, Ph.D. Millikin University”
    “May I suggest that you obtain and refer to a standard textbook on probability before you try to answer a question of this type again? Charles Reid, Ph.D. University of Florida”
    “You are utterly incorrect … How many irate mathematicians are needed to get you to change your mind? E. Ray Bobo, Ph.D. Georgetown University”

Mesmo o notável, legendário e excêntrico matemático húngaro, Paul Erdős, o mais publicado nos tempos modernos, segundo a wikipedia achou difícil acreditar na Marilyn e admitiu só ter se convencido depois que uma simulação por computador confirmou.

 
Pois é, a Marilyn estava certa.

Mas se você errou, sinta-se em boa companhia.

 

Testinho 10

É fácil mas poderia cair em um teste de admissão para o Google:

Segundo o Netcraft – September 2012 Web Server Survey, em setembro havia no mundo 620,132,319 sites (menos 8 milhões desde a pesquisa do mês anterior). Segundo o WorldWideWebSize.com, chegou a existir em setembro, mais de 50 bilhões de páginas indexadas.

 

Seu problema é o seguinte:

Você tem que tratar 50 bilhões de URLs antes da indexação (*) e sabe que muitas delas podem corresponder a páginas bem grandes.

Pergunta:

    Como detectaria paginas web duplicadas?

 
Descreva a solução, como armazenaria e como pesquisaria. Nem precisa escrever código mas se o fizer use o gist e coloque só o link nos comentários.

 
PS: Fui bonzinho e limitei o número de URLs. O Google não indexa TODAS as URLs mas segundo o blog deles em We knew the web was big…, em 2008 existiam mais de um trilhão de URLs únicas. Não são um trilhão de páginas web únicas, ver explicação abaixo em (*).

(*) “We start at a set of well-connected initial pages and follow each of their links to new pages. Then we follow the links on those new pages to even more pages and so on, until we have a huge list of links. In fact, we found even more than 1 trillion individual links, but not all of them lead to unique web pages.”