Dados Aleatórios

Dados Aleatórios

R também pode ser diversão!

O R, assim como toda linguagem de programação, permite que seja feita uma grande gama de coisas, mesmo quando elas não possuem nada a ver com estatística. Dois exemplos disso podem ser encontrados no próprio site do R: os pacotes fun e sudoku, que possuem algumas funções para passar o tempo, inclusive jogos. Sim, você leu certo: jogos no R. Para passar o tempo livre que eu tinha na época de graduação (que meus professores não vejam isso…) e inspirado nos pacotes citados anteriormente, me desafiava a fazer alguns jogos no R também.

Curso de Data Science

Venho aqui apresentar a Elixir Data Science, uma empresa com um modelo de Data Science As a Service que possibilita, oferecendo um custo acessível, tanto empresas grandes quanto pequenas de tomar melhores decisões baseadas em dados. A empresa atua em todo o workflow de análise de dados, desde aquisição e manutenção dos dados até a disponibilização de modelos preditivos em ambiente de produção. Os cursos oferecidos pela Elixir Data Science focam em utilizar cases reais para estimular o pensamento crítico e analítico, sem deixar de lado a metodologia necessária para o entendimento sólido dos conceitos apresentados.

Dados públicos

Recentemente foi enviado um e-mail a lista de R perguntando por dados públicos (link). Mesmo trabalhando há mais de 1 ano com alguns desses dados, algumas das respostas eu não conhecia e por isso resolvi fazer um agregado das respostas e postar aqui no blog. Junto com as fontes, postarei links de postagens que fazem alguma análise nos bancos informados e algumas ressalvas sobre os bancos. Instituto Brasileiro de Geografia e Estatística (IBGE) Impossível começar uma lista com fontes de dados estatísticos sem ser pelo IBGE.

Carregando automaticamente funções e outras variáveis no R

Quem trabalha com R sabe que é necessário, sempre que se abre o R, recarregar todos pacotes e funções que se deseja. E isso pode se tornar trabalhoso e repetitivo, especialmente quando se utiliza sempre os mesmos. Mas existe uma maneira de automatizar isso - e bem simples até! Sempre que o R é iniciado ele irá executar o arquivo Rprofile.site (ele fica na pasta R\x.x.x\etc, e pode ser aberto com o bloco de notas).

Factors são... Números?

A utilização de objetos da classe factor no R pode surpreender usuários novos, uma vez que a representação e manipulação destes sugere que são similares a manipulação de strings, porém muitas das vezes o usuário acaba tendo uma surpresa desagradável, assim como um comportamento não esperado de objetos deste tipo. Mas antes de tudo, vamos esclarecer uma coisa: Factors não são e nem devem ser vistos como strings e sim como objetos numéricos (para ser mais preciso, inteiros).

5 Curiosidades sobre o brasileirão 2014

Campeonato brasileiro acabou ano passado, mas há quem diga que brasileiro nunca cansa de futebol, não é? Então seguem algumas curiosidades sobre o campeonato brasileiro 2014. Se olharmos para cada uma das posições, os que mais pontuam em média são os técnicos (média de 3.18 pontos por rodada), seguido dos laterais (média de 1.1 pontos por rodada). Já entre os que menos pontuam são os meias (média de 0.77 por rodada) seguindo dos goleiros (média de 0.

Dados do Bolsa Família

Muito se falou sobre o Bolsa Família esse ano, principalmente depois do [apertado] resultado das eleições, criticando o governo por “dar o peixe ao invés de ensinar a pescar” ou até mesmo acusando de compra de votos com dinheiro público. Mas você já parou para analisar os dados do Bolsa Família? Pois é o que vamos fazer nessa postagem! O governo federal divulga, através do Portal da Transparência, os dados do CADÚnico (Cadastro único para programa sociais do governo federal) e a folha de pagamento do Bolsa Família, nome a nome, mês a mês.

StackExchange

Sabe aquela dúvida que você tem sobre um determinado assunto, mas que nunca conseguiu sanar? Talvez o StackExchange seja a solução! O StackExchange é uma rede de sites onde os usuários podem fazer e responder perguntas. Os usuários que fizerem boas perguntas ou darem boas respostas são ‘premiados’ com pontos conforme vão recebendo votos dos usuários, e esses votos são os critério de ordenamento das respostas. Além da pontuação, o usuário que fez a pergunta pode escolher uma resposta como a correta (ou a melhor), que ficará destacada.

Cores nos gráficos do R

Muitas vezes queremos demonstrar mais de um objeto em um gráfico e, para isso, recorremos à cores diferentes. Quando são poucos elementos fica fácil escolher as cores, geralmente ficamos com ‘black’, ‘red’, ‘green’ e ‘blue’. Mas e quando queremos mais cores, ou até mesmo, sair da mesmice? O R, geralmente, permite dois tipos de entrada de cor: RGB em hexadecimal e através do nome das cores. Ao total, o R possui 657 cores pré-definidas (isso é, com algum nome) que podem ser vistas através do comando colours().

Input manual de dados no R

Vamos utilizar um editor, como a vizualização de folha de dados do excel para inputar nossos dados ao R. dados <- data.frame(Idade=numeric(0), Sexo=character(0), Peso=numeric(0)) dados <- edit(dados) Após entrar com todos os dados que necessitar, podemos simplesmente fechar o editor e teremos um data.frame salvo na variável dados =) Depois de fechar o editor podemos chamar a variável dados e vamos obter o seguinte resultado. Bom essa é a dica, bem simples e rápida.