Dados Aleatórios

Dados Aleatórios

Factors são... Números?

A utilização de objetos da classe factor no R pode surpreender usuários novos, uma vez que a representação e manipulação destes sugere que são similares a manipulação de strings, porém muitas das vezes o usuário acaba tendo uma surpresa desagradável, assim como um comportamento não esperado de objetos deste tipo. Mas antes de tudo, vamos esclarecer uma coisa: Factors não são e nem devem ser vistos como strings e sim como objetos numéricos (para ser mais preciso, inteiros).

5 Curiosidades sobre o brasileirão 2014

Campeonato brasileiro acabou ano passado, mas há quem diga que brasileiro nunca cansa de futebol, não é? Então seguem algumas curiosidades sobre o campeonato brasileiro 2014. Se olharmos para cada uma das posições, os que mais pontuam em média são os técnicos (média de 3.18 pontos por rodada), seguido dos laterais (média de 1.1 pontos por rodada). Já entre os que menos pontuam são os meias (média de 0.77 por rodada) seguindo dos goleiros (média de 0.

Dados do Bolsa Família

Muito se falou sobre o Bolsa Família esse ano, principalmente depois do [apertado] resultado das eleições, criticando o governo por “dar o peixe ao invés de ensinar a pescar” ou até mesmo acusando de compra de votos com dinheiro público. Mas você já parou para analisar os dados do Bolsa Família? Pois é o que vamos fazer nessa postagem! O governo federal divulga, através do Portal da Transparência, os dados do CADÚnico (Cadastro único para programa sociais do governo federal) e a folha de pagamento do Bolsa Família, nome a nome, mês a mês.

StackExchange

Sabe aquela dúvida que você tem sobre um determinado assunto, mas que nunca conseguiu sanar? Talvez o StackExchange seja a solução! O StackExchange é uma rede de sites onde os usuários podem fazer e responder perguntas. Os usuários que fizerem boas perguntas ou darem boas respostas são ‘premiados’ com pontos conforme vão recebendo votos dos usuários, e esses votos são os critério de ordenamento das respostas. Além da pontuação, o usuário que fez a pergunta pode escolher uma resposta como a correta (ou a melhor), que ficará destacada.

Cores nos gráficos do R

Muitas vezes queremos demonstrar mais de um objeto em um gráfico e, para isso, recorremos à cores diferentes. Quando são poucos elementos fica fácil escolher as cores, geralmente ficamos com ‘black’, ‘red’, ‘green’ e ‘blue’. Mas e quando queremos mais cores, ou até mesmo, sair da mesmice? O R, geralmente, permite dois tipos de entrada de cor: RGB em hexadecimal e através do nome das cores. Ao total, o R possui 657 cores pré-definidas (isso é, com algum nome) que podem ser vistas através do comando colours().

Input manual de dados no R

Vamos utilizar um editor, como a vizualização de folha de dados do excel para inputar nossos dados ao R. dados <- data.frame(Idade=numeric(0), Sexo=character(0), Peso=numeric(0)) dados <- edit(dados) Após entrar com todos os dados que necessitar, podemos simplesmente fechar o editor e teremos um data.frame salvo na variável dados =) Depois de fechar o editor podemos chamar a variável dados e vamos obter o seguinte resultado. Bom essa é a dica, bem simples e rápida.

Ordenando o gráfico de barras no ggplot

Anteriormente já abordamos dois posts sobre o ggplot: o primeiro deles falava sobre a personalização das escalas dos eixos e outro sobre como fazer gráficos múltiplos no ggplot. Hoje vamos continuar abordando o tema e o post será sobre a ordenação do gráfico de barras. Naturalmente a ordem das barras é controlada através de fatores, que são uma estrutura de dados utilizada para representar categorias - que é diferente do caractere.

Fazendo múltiplos gráficos com o ggplot2

Fazer múltiplos gráficos de acordo com o nível de uma ou mais variáveis categóricas no ggplot2 é fácil: basta utilizar as funções facet_grid ou facet_wrap. Com essas funções, tudo que você fizer para um gráfico valerá para todos (tema, títulos, rótulos dos eixos). E nos casos que eu preciso gráficos independentes - não só com configurações diferentes, mas também gráficos de tipos diferentes - como faço? Infelizmente, o ggplot2 não possui suporte para esse tipo de gráfico.

Alterando a escala dos eixos no ggplot2

Muitas vezes precisamos mexer na escala de um gráfico - seja para mais ou para menos. No pacote base é bastante fácil fazer isso, as principais funções gráficas possuem os parâmetros xlim e ylim para informarmos os limites dos eixos. O pacote ggplot2 até apresenta as funções xlim e ylim, mas elas não funcionam exatamente igual aos parâmetros do pacote base. A diferença está que, além de alterar os limites do gráfico, ele descarta todos os dados que estão fora desse intervalo.

Profissão: Estatístico

Na maioria das vezes que eu dizia que ia cursar (ou que estava cursando) estatística eu via 2 reações: ou as pessoas achavam que era uma área do curso de matemática (“Ah, matemática, legal!”) ou se diziam surpresas por ter um curso somente para estatística (afinal de contas, eles veem ‘toda’ estatística em 2 cadeiras). Eu sabia que era um curso pouco concorrido, mas será que é tão pouco conhecido? Esses dias resolvi ir atrás de estatísticas a respeito dos estatísticos.