Categorias
Artigos

Minha jornada em aprender R (ou: o conflito entre foco e exploração)

Eu me sinto em um conflito intelectual enorme entre dois aspectos de trabalho, simbolizados por duas grandes influências minhas: Cal Newport (foco e prioridade é tudo que importa) e Austin Kleon (como deve se expor ao máximo de influências e roubar delas para fazer a sua arte).

Exceto que este conflito não existe. Cal Newport lê no mínimo 5 livros por mês, sobre assuntos variados, e Austin Kleon fala da importância de desligar suas notificações e ter uma boa estação de trabalho onde se concentrar. O trabalho consiste em ciclos de se aprofundar e explorar.

O que me leva a um objetivo vago na minha vida profissional, que é aprender a linguagem de programação R, uma ferramenta bastante focada em estatística e ciência de dados.

Eu não consigo me lembrar como comecei a me interessar por isso, mas se fosse apostar, diria que foi quando Dr. Drang linkou algum post de Kieran Healy, um professor de Sociologia da Duke University que posta sobre como criar gráficos muito interessantes e ricos usando R . Isso deve fazer uns 5 anos, por volta de 2017.

Em 2019, quando comecei a utilizar bastante os conceitos de ciência de dados e quis aprender mais, comprei os livros da foto acima, mas nunca mergulhei de fato.

Nesse ano de 2022, decidi que era de mergulhar nisso. Mas aí está o problema: como vou priorizar isso dentro do meu problema de foco? Eu não preciso estudar R, e não vou ter proveito imediato.

Porém , foi numa tarde onde tirei uns 90 minutos para começar a ler o livro R for Data Science que me deparei com um exemplo do livro sobre dados experimentais de motores – uma biblioteca de R tem uma tabela já pronta. Por que essa minha empolgação? Porque eu ministro duas disciplinas sobre motores, e já consigo pensar em muitas maneiras de explorar esses dados na sala de aula. Sem essa perda de tempo brincando de estudar, eu talvez nunca teria chegado nesse exemplo.

Brincando com RStudio

Brincando em mais algumas sessões de trabalho, o resultado é saber produzir um gráfico como esse:

Aqui nós temos dados de alguns motores catalogados pela Agência de Proteção Ambiental dos EUA entre 1999 e 2008. Há uma tendência geral de queda da eficiência: motores maiores consomem mais combustível. Mas! Há outros fatores em jogo: a linha de tendência mais inferior mostra apenas veículos de tração nas 4 rodas, que são consistentemente menos eficientes que veículos de tração em 2 rodas (o leitor sabia disso?). Analisando por classes, vemos que na faixa de cilindradas maiores há exemplos de carros que são mais eficientes que outros: 2seaters, ou carros esportivos de 2 lugares. Esse veículos usam motores potentes, mas consomem menos que um SUV de mesmo tamanho, porque são mais leves, com menos perdas no sistema de transmissão; eu acredito também que o sistema de exaustão desses veículos esportivos faça diferença, com conversores catalíticos de parede metálica, mais fina, que têm menos perdas de potências (à custa de mais emissões).

Essa discussão de um parágrafo acima é muito útil para ser levada para a sala de aula. Eu perdi tempo estudando R?

Agora estou nessa situação; tirando algumas sessões de trabalho a cada mês para avançar na leitura desses livros, encaixando no meu planejamento semanal. Tenho sonhado em finalmente escrever apostilas de notas de aulas usando bookdown, de maneira que o código para resolver exercícios seja parte do texto, e divulgar essas notas de aula para o Brasil todo. O ecossistema de R põe muita ênfase na publicação e compartilhamento de dados – algo que não vejo em Python, por exemplo, daí o meu interesse em uma ferramenta nova (já que tenho usado Python para meus projetos científicos há mais de 1o anos).

Como a leitora faz para balancear entre o foco e a exploração? O leitor consegue achar tempo no meio da semana para simplesmente explorar algum assunto e “ver no que vai dar”?

Por Fábio Fortkamp

Pai do João Pedro, Marido da Maria Elisa, Professor do Departamento de Engenharia Mecânica da Universidade do Estado de Santa Catarina, católico devoto, nerd

6 respostas em “Minha jornada em aprender R (ou: o conflito entre foco e exploração)”

Olá Fábio, obrigada pelo retorno! Uso o R para análises estatísticas (uni e multivariada), e mais recentemente, estou estudando no R sobre análise de dados oriundos de genoma/transcriptoma (analise de expressão de genes) em plantas que produzem metabólitos bioativos que podem ser futuros protótipos de fármacos.

Um dos melhores professores que tive na udesc até hoje, te admiro demais. Tô tentando me mergulhar na linguagem Julia por curiosidade e para utilizar no mestrado que início metade do ano. Cadê o foco???

Deixe um comentário

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.