Concrete Logo
Hamburger button

Testinho 5

  • Blog
  • 13 de Fevereiro de 2012
Share

[fblike]

 
Este testinho não era para sair hoje. Por absoluta falta de tempo, só poderei colocar a solução daqui a duas semanas ou pouco mais. Mas tem coisas que pedem para aparecer. Definitivamente este foi o caso e pediu duas vezes:

  • 1. Hoje eu e o Renato Elias almoçamos com o Hugo Borges, o popular Agaelebe e mais o Fabiano Beselga e o Rinaldi Fonseca. Na saída o assunto foi recomendação e machine learning.
  • 2. Para este texto, que já estava pronto e guardado para mais tarde, tinha escolhido a Quadrilha de Drummond. Este desencontro amoroso, carregado de anti-lirismo, de ironia seca e amarga, poema-piada em versos livres, de certa forma tem a ver com um desafio (bem difícil) de machine learning. E também é tipicamente modernista.

    Ora, a semana de arte moderna de 1922 exatamente hoje completa 90 anos. Drummond não participou mas seu poema “No meio do caminho” foi um marco no modernismo brasileiro.

Então, juntando as duas oportunidades, aí vai um testinho de machine learning e fica aqui a homenagem aos moços que em 1922 deflagaram um movimento de renovação das artes brasileiras. Mesmo considerando que entre os tais moços não se incluíam todos os melhores na cultura brasileira da época, eles tiveram o mérito de criar um clima de ruptura e mexer com o status quo. Para mim isto tem muito a ver com a mente inovadora da nossa gente de TI.

 

O testinho é bem fácil. Quase só de aplicação de fórmula e fixação de conhecimentos. Na verdade é só um pouquinho mais do que a aplicação direta da fórmula de classificação de Bayes. Mas tem uns conceitinhos adicionais de machine learning. Desculpem a insistência mas acho atuais e importantes esses conceitos de recomendação e classificação.

 

Aqui na Concrete SP tem uma turma que gosta de jogar volei aos Sábados no Ibirapuera. Quando minha coluna estava boa, eu ia correndo até lá para ver se encontrava alguém. Só que nem sempre tinha gente jogando. Eu queria ter um meio de saber as chances dos caras estarem lá.

O que poderia ter feito: anotar as características de tempo dos dias em que eles jogaram e colocar em uma tabela semelhante a que está abaixo:

Tempo Temperatura Umidade Vento Jogaram

Sol

quente

alta

não

não

Sol

quente

alta

sim

não

nuvens

quente

alta

não

sim

chuva

boa

alta

não

sim

chuva

frio

normal

não

sim

chuva

frio

normal

sim

não

nuvens

frio

normal

sim

sim

Sol

boa

alta

não

não

Sol

frio

normal

não

sim

chuva

boa

normal

não

sim

Sol

boa

normal

sim

sim

nuvens

boa

alta

sim

sim

nuvens

frio

normal

não

sim

chuva

boa

alta

sim

não

Se assim tivesse feito tal tabela e se fosse um Sábado de Sol, temperatura baixa, umidade alta e com vento, como responderia às perguntas abaixo:

1)   É mais provável que eles joguem nesse Sábado ou as chances são contra?

2)   Qual a probabilidade de jogarem e qual a probabilidade de não jogarem?

3)   A partir da tabela seria possível escrever uma regra que pudesse ser aplicada a todos os Sábados? Como ficaria?

 

É isso aí, vocês já tem o que fazer no Carnaval. Bom divertimento!