Posts do

post-image

Introdução ao GIT

O que é o GIT? No cotidiano de nossas tarefas acabamos por criar varias “versões finais” dos nossos projetos, como ilustrado abaixo.

Leia mais
post-image

Introdução ao ggplot

Este material tem por objetivo passar uma ideia inicial das funcionalidades do pacote ggplot2 na visualização de dados.

Leia mais
post-image

Help functions do dplyr

Este post supõe que estamos minimamente familiarizados com o pacote dplyr (se você não está, veja este post), especialmente com a função select e com o pipe.

Leia mais
post-image

Introdução ao dplyr

O que é o dplyr e por que usá-lo? dplyr é um pacote do R para manipulação de dados, sendo um dos pacotes que forma o núcleo do tidyverse.

Leia mais
post-image

Google Vision API

Continuando as postagens relacionadas a machine learning, agora vamos falar sobre a identificação de objetos em fotos.

Leia mais
post-image

Identificando emoções em fotos

Não é novidade para nós que trabalhamos com análise de dados que a área de Machine Learning (ou no bom português, aprendizado de máquina) está evoluindo rapidamente, mas o que muitos podem desconhecer é que este conhecimento está ao alcance de todos, e muitos de forma gratuita (mesmo que limitada).

Leia mais

Lendo arquivos OFX no R

Há um tempo atrás, a Nubank (se você não sabe o que é Nubank, deveria) postou em sua página que era possível exportar as faturas fechadas, para serem levadas a programas de organização financeira.

Leia mais
post-image

Coletando dados do Facebook

Em nossas últimas postagens mostramos duas maneiras de extrair informações de sites: através do código fonte do site, manipulando diretamente no R e através do pacote RSelenium.

Leia mais

Primeiros contatos com o RSelenium

Mostramos em nossa última postagem que é possível baixar dados/arquivos de sites através do R - o site em questão era bastante antigo e simples, o que facilitou a extração das informações desejadas.

Leia mais
post-image

Uma nova maneira de ler dados externos

Há cerca de 2 anos atrás postei uma pergunta no StackOverflow (caso não conheça, leia esta postagem nossa) perguntando como podia fazer para ler grandes bancos de dados, de cerca de 600mb - esse era meu primeiro contato com bancos grandes, provenientes do Censo Escolar.

Leia mais

R também pode ser diversão!

O R, assim como toda linguagem de programação, permite que seja feita uma grande gama de coisas, mesmo quando elas não possuem nada a ver com estatística.

Leia mais

Curso de Data Science

Venho aqui apresentar a Elixir Data Science, uma empresa com um modelo de Data Science As a Service que possibilita, oferecendo um custo acessível, tanto empresas grandes quanto pequenas de tomar melhores decisões baseadas em dados.

Leia mais

Factors são... Números?

A utilização de objetos da classe factor no R pode surpreender usuários novos, uma vez que a representação e manipulação destes sugere que são similares a manipulação de strings, porém muitas das vezes o usuário acaba tendo uma surpresa desagradável, assim como um comportamento não esperado de objetos deste tipo.

Leia mais
post-image

Dados do Bolsa Família

Muito se falou sobre o Bolsa Família esse ano, principalmente depois do [apertado] resultado das eleições, criticando o governo por “dar o peixe ao invés de ensinar a pescar” ou até mesmo acusando de compra de votos com dinheiro público.

Leia mais
post-image

StackExchange

Sabe aquela dúvida que você tem sobre um determinado assunto, mas que nunca conseguiu sanar?

Leia mais

Profissão: Estatístico

Na maioria das vezes que eu dizia que ia cursar (ou que estava cursando) estatística eu via 2 reações: ou as pessoas achavam que era uma área do curso de matemática (“Ah, matemática, legal!

Leia mais

Participação nas eleições de 2010

Todo ano eleitoral é a mesma coisa: partidos/candidatos tentando convencer que são melhores que os adversários, seja mostrando seus projetos/feitos ou criticando os dos adversários.

Leia mais

Trabalhando com amostras complexas no R: usando o pacote survey

Ao contrário da amostra aleatória simples, nos planos amostrais complexos as unidades amostrais (geralmente, pessoas) possuem probabilidades diferentes de serem amostradas quando comparadas com outras unidades amostrais e, devido a isso, todas as análises realizadas sobre amostras complexas devem levar em consideração a probabilidade de cada um dos indivíduos amostrados.

Leia mais

Interagindo com o usuário no R

A interação com o usuário é fundamental em diversos processos, e pode ocorrer de muitas maneiras: desde uma simples janela de Continuar/Parar até a seleção de diversos valores em uma lista.

Leia mais
post-image

Microdados da RAIS

Dando início à minha série de postagens aqui no Dados Aleatórios, irei falar sobre os microdados da RAIS - Relação Anual de Informações Sociais - disponibilizados pelo Ministério do Trabalho e Emprego.

Leia mais

Review do livro Social Media Mining with R

Introdução Mídias sociais são o verdadeiro assunto do momento. Se antes a informação era centralizada por veículos de comunicação, hoje a coisa é um pouco diferente, seja por desconfiança da população nos veículos mais tradicionais ou pela velocidade com que as coisas acontecem e são passadas aos leitores.

Leia mais