Categorias
Listas de livros

Bons livros lidos, Verão 2022-2023

Uma estação está acabando, e uma das coisas que gosto de fazer (pra variar, inspirado pelo Austin Kleon) é rever os livros que li nessa estação, para ver se há algum tema.

Apesar de que o ano passado foi supostamente o Ano de Ler e Escrever, a leitura de livros acabou ficando para trás, frente a estudos e escritas de notas. O verão que agora acaba marca uma volta muito profunda aos livros, como forma de entretenimento e como fonte das maiores ideias para seu trabalho, como PH Santos muito bem ilustra nesse excelente vídeo:

Excelente vídeo sobre usar livros para produzir outras coisas

Se o Ano atual é de Simplificar, o Verão foi a Estação de Simplificar as Finanças, e para isso I Will Teach You to be Rich, de Ramit Sethi, foi fundamental. Eu tenho grandes problemas com a criação de jargão artificial nessa obra, como um “Plano de Gastos Conscientes” e o “Método dos Envelopes”, que são apenas técnicas de orçamento (apesar de o autor jurar que você não precisa organizar o seu orçamento). Mas a sua abordagem prática em acumular pontos em cartão de crédito e em como organizar categorias de gastos de uma maneira realista tiveram grande impacto em mim. Esse livro me mostrou que, se eu otimizar os gastos fixos, cuidando da minha família, ao mesmo tempo em que tento investir um mínimo viável e de maneira inteligente, eu posso sim gastar com livros, se isso é realmente importante para mim.

Um livro que comprei desde que adquiri essa mentalidade e que já é um dos meus livros favoritos de toda a vida é Amigos, Amores e Aquela Coisa Terrível, o livro de memórias do Chandler de Friends. A sua maneira livre, honesta e profunda de escrever sobre problemas foi muito importante em algumas semanas particularmente depressivas. Os problemas existem; se você escreve sobre eles, eles não diminuem, mas também não aumentam.

Como inspiração para o trabalho, o duo de livros de Nathan Yau, Visualize This e Data Points (embora esse último seja bem raso e um pouco inútil para quem já sabe um pouco sobre visualização de dados), me ajudou a pensar mais como cientista de dados ao analisar resultados de simulações no meu emprego. Mesmo que eu não tenha aprendido nada de muito nova, ajudou-me a reforçar algumas ideias de organização de dados (lembrando que é sua tarefa fazer isso).

E agora: que livros me esperam no Outono?

Categorias
Artigos

O que fazer com dados errados/faltantes/desorganizados? Parar de reclamar!

Não quero parecer mais velho e experiente do que sou, mas eu tenho certa experiência de Engenharia. Depois de me formar, há 11 anos, completei um Mestrado e um Doutorado, fiz estágio de Pós-Doutorado, trabalhei como professor, e atualmente sou engenheiro em um projeto de pesquisa. Participei de muitos projetos diferentes, com empresas diferentes, com assuntos e contextos diversos.

Sendo professor e pesquisador, interajo com muitos alunos e alunas, engenheiros e engenheiras menos experientes que eu, e é muito comum ouvir variações do tipo:

  • “Onde consigo esses dados?”
  • “A empresa X compartilhou os dados de maneira muito desorganizada”
  • “Os dados de medição e calibração estão num arquivo PDF, como vou usar isso no meu script?”

Engenheiros e engenheiras, pesquisadores e pesquisadoras: trabalhar com dados errados/faltantes/desorganizados não é um impedimento ao seu trabalho, é o trabalho.

A vida de Engenharia não é a vida dos livros-texto, onde as tabelas são bonitinhas. Os dados passam por mãos humanas, onde há algum erro (mesmo que sejam obtidos de um sensor de maneira automática, alguém programou aquele sensor).

Seja cuidadoso ao digitar seus dados manualmente. Muitos erros bobos aparecem quando se transferem dados de uma fonte para outra .

[…]

Muito da visualização envolve coletar e preparar dados. Raramente, você consegue os dados na forma como você precisa, então espere dar uma arrumada nos dados antes de visualiza-los.

Nathan Yau, Visualize This (Tradução livre minha)

Quer outra citação?

Para se tornar um cientista de dados, você precisa de dados. Na verdade, como um cientista de dados, você passará uma embaraçosa grande fração do seu tempo adquirindo, limpando e transformando dados.

Joel Grus, Data Science do Zero

Nesta bela tarde de segunda-feira, pegue uma xícara de café, abra o Excel com aquele arquivo desorganizado que você recebeu de alguém (ou use Tabula para extrair tabelas de PDFs), e confira os detalhes:

  • As unidades estão certas?
  • O separador decimal (ponto ou vírgula) está correto?
  • Os dados estão numéricos (1 em vez de “1”)?
  • Há linhas com colunas faltantes? Por quê? Adicione uma coluna de observações.
  • Valores nulos (de valor numérico 0) ou negativos são isso mesmo, ou algum sinal de erro do sensor?

Repito: ninguém vai fazer isso para você. Você precisa pensar sobre os dados – e sobre o que você quer fazer com eles.