Profissão: Estatístico

Na maioria das vezes que eu dizia que ia cursar (ou que estava cursando) estatística eu via 2 reações: ou as pessoas achavam que era uma área do curso de matemática ("Ah, matemática, legal!") ou se diziam surpresas por ter um curso somente para estatística (afinal de contas, eles veem 'toda' estatística em 2 cadeiras). Eu sabia que era um curso pouco concorrido, mas será que é tão pouco conhecido? Esses dias resolvi ir atrás de estatísticas a respeito dos estatísticos.

O primeiro dado que procurei foi quantos estatísticos existem no Brasil. Infelizmente não encontrei nenhuma estatística de formaturas no INEP e nem o CONFE possui em seu site a quantidade de estatísticos registrados. Para tentar encontrar um valor aproximado recorri a duas fontes diferentes: IBGE e MTE (Ministério do Trabalho e Emprego).

Facilitando a criação de posters/banners com LaTeX.

Muitas vezes quando precisamos expor nossos estudos e análises, precisamos fazer em forma de poster ou banner para apresentações em congressos e eventos.
E nem sempre está é uma tarefa fácil, mas vamos tentar simplificar utilizando o LaTeX com o pacote baposter, que é um pacote bem simples porém com opções visuais bem bacanas.
Nesse primeiro momento vamos colocar um exemplo prático de um banner utilizando o baposter como vamos ver abaixo

Criando classes de objetos e métodos

Muitos dos objetos que manuseamos no R possuem mais informações do que costumamos ver. Por exemplo, em uma regressão linear tudo que o R mostra são os coeficientes do modelo e o comando utilizado, mas ao utilizarmos o comando str() vemos que na verdade o resultado é uma lista com pelo menos 12 elementos (sendo que alguns elementos também são listas). Então, o que diferencia essa lista das listas criadas pelo list()? A resposta é simples: a sua classe.

Algumas vezes criamos funções que não retornam apenas o resultado desejado, mas também informações adicionais, que podem ou não vierem a serem úteis mais para frente. Essas informações nem sempre são interessantes de serem exibidas ao darmos print no resultado. Voltamos ao exemplo da regressão linear: um dos elementos da lista resultante são os resíduos do modelo, informação extremamente importante para analisar a adequabilidade do modelo, mas que não acrescenta nada se for exibido junto com o modelo (a menos que você seja capaz de realizar a análise residual de olho...) e por isso eles são omitidos na hora da exibição do modelo. Mas como fazer isso para a minha função? A resposta também é simples: crie uma classe e métodos próprio.


Programando no R com Notepad++

Dentre os vários editores de código existentes (aqui tem uma lista com 10), o que escolhi utilizar foi o Notepad++. Antes dele, utilizava o tradicional bloco de notas do Windows e fui bastante resistente em abandonar ele, trocando apenas quando meus códigos começaram a ficar grandes. Com o tempo fui descobrindo as funcionalidades dele, como a indentação em bloco, a identificação dos pares de {} e () - o que me fez abandonar o bloco de notas - e a busca e substituição por expressões regulares. O Notepad++ também colore o código de acordo com a linguagem informada, reconhecendo as principais funções do R. Mas ainda faltava algo: uma lista com as funções e parâmetros do R. Faltava, pois não falta mais.