Logo

Dados Aleatórios - Seu blog técnico de ciências de dados!

Dados Aleatórios é um projeto que visa divulgar e tornar acessível ao público em geral informações técnicas sobre diversas áreas do conhecimento, em particular, programação e as mais diversas aplicações de estatística.

Integrantes do Dados Aleatorios

Últimas Postagens do Blog

  • post-image

    SQL - Primeiros Passos

    E aí galera, tudo bem? Eu sou Larissa e é a minha primeira vez escrevendo para o blog.

  • post-image

    Programando com dplyr (tidy eval)

    E aí, pessoal! Depois de conhecer o dplyr (se ainda não conhece, veja aqui nosso post de introdução), começamos a escrever nossos códigos usando as funções desse pacote, e o costume de usar o dplyr acaba nos fazendo pensar em escrever nossas próprias funções usando alguns comandos do dplyr.

  • post-image

    Diferenças entre segmentação e clusterização

    Na modelagem de marketing, o termo “clustering” é muito usado.

  • post-image

    Cartão de Natal com o R

    Já pensou em fazer um cartão de Natal utilizando a plataforma que os nerds dos dados mais gostam?

  • post-image

    Introdução ao tidyr

    O pacote tidyr tem como principal objetivo transformar um data frame para o formato tidy, ou limpo.

  • post-image

    Introdução ao GIT

    O que é o GIT? No cotidiano de nossas tarefas acabamos por criar varias “versões finais” dos nossos projetos, como ilustrado abaixo.

  • post-image

    Introdução ao ggplot

    Este material tem por objetivo passar uma ideia inicial das funcionalidades do pacote ggplot2 na visualização de dados.

  • post-image

    Scoped functions do dplyr

    Este post faz parte da série de post que estamos criando sobre o dplyr.

  • post-image

    Help functions do dplyr

    Este post supõe que estamos minimamente familiarizados com o pacote dplyr (se você não está, veja este post), especialmente com a função select e com o pipe.

  • post-image

    Introdução ao dplyr

    O que é o dplyr e por que usá-lo?

  • post-image

    Google Vision API

    Continuando as postagens relacionadas a machine learning, agora vamos falar sobre a identificação de objetos em fotos.

  • post-image

    Identificando pessoas em fotos

    Dando sequência à postagem anterior, vamos falar um pouco agora sobre outra API do Microsoft Cognitive Services: a Face API.

  • post-image

    Identificando emoções em fotos

    Não é novidade para nós que trabalhamos com análise de dados que a área de Machine Learning (ou no bom português, aprendizado de máquina) está evoluindo rapidamente, mas o que muitos podem desconhecer é que este conhecimento está ao alcance de todos, e muitos de forma gratuita (mesmo que limitada).

  • Lendo arquivos OFX no R

    Há um tempo atrás, a Nubank (se você não sabe o que é Nubank, deveria) postou em sua página que era possível exportar as faturas fechadas, para serem levadas a programas de organização financeira.

  • post-image

    Coletando dados do Facebook

    Em nossas últimas postagens mostramos duas maneiras de extrair informações de sites: através do código fonte do site, manipulando diretamente no R e através do pacote RSelenium.

  • Primeiros contatos com o RSelenium

    Mostramos em nossa última postagem que é possível baixar dados/arquivos de sites através do R - o site em questão era bastante antigo e simples, o que facilitou a extração das informações desejadas.

  • post-image

    Baixando e interpretando sites (ou: como fazer backup do seu fotolog) com R.

    Se você usava a internet no início dos anos 2000, muito provavelmente teve - ou quis ter - um Fotolog.

  • Modelagem Preditiva: Aprendendo a partir dos dados

    Mas então a máquina faz tudo e não é necessária nenhum tipo de intervenção humana?

  • post-image

    É possível aumentar as chances na loteria?

    Sempre que o final do ano se aproxima boa parte dos brasileiros começa a pensar em uma coisa: a mega da virada.

  • post-image

    Uma nova maneira de ler dados externos

    Há cerca de 2 anos atrás postei uma pergunta no StackOverflow (caso não conheça, leia esta postagem nossa) perguntando como podia fazer para ler grandes bancos de dados, de cerca de 600mb - esse era meu primeiro contato com bancos grandes, provenientes do Censo Escolar.

  • R também pode ser diversão!

    O R, assim como toda linguagem de programação, permite que seja feita uma grande gama de coisas, mesmo quando elas não possuem nada a ver com estatística.

  • Curso de Data Science

    Venho aqui apresentar a Elixir Data Science, uma empresa com um modelo de Data Science As a Service que possibilita, oferecendo um custo acessível, tanto empresas grandes quanto pequenas de tomar melhores decisões baseadas em dados.

  • Dados públicos

    Recentemente foi enviado um e-mail a lista de R perguntando por dados públicos (link).

  • Carregando automaticamente funções e outras variáveis no R

    Quem trabalha com R sabe que é necessário, sempre que se abre o R, recarregar todos pacotes e funções que se deseja.

  • Factors são... Números?

    A utilização de objetos da classe factor no R pode surpreender usuários novos, uma vez que a representação e manipulação destes sugere que são similares a manipulação de strings, porém muitas das vezes o usuário acaba tendo uma surpresa desagradável, assim como um comportamento não esperado de objetos deste tipo.

  • post-image

    5 Curiosidades sobre o brasileirão 2014

    Campeonato brasileiro acabou ano passado, mas há quem diga que brasileiro nunca cansa de futebol, não é?

  • post-image

    Dados do Bolsa Família

    Muito se falou sobre o Bolsa Família esse ano, principalmente depois do [apertado] resultado das eleições, criticando o governo por “dar o peixe ao invés de ensinar a pescar” ou até mesmo acusando de compra de votos com dinheiro público.

  • post-image

    StackExchange

    Sabe aquela dúvida que você tem sobre um determinado assunto, mas que nunca conseguiu sanar?

  • post-image

    Cores nos gráficos do R

    Muitas vezes queremos demonstrar mais de um objeto em um gráfico e, para isso, recorremos à cores diferentes.

  • Input manual de dados no R

    Vamos utilizar um editor, como a vizualização de folha de dados do excel para inputar nossos dados ao R.

  • post-image

    Ordenando o gráfico de barras no ggplot

    Anteriormente já abordamos dois posts sobre o ggplot: o primeiro deles falava sobre a personalização das escalas dos eixos e outro sobre como fazer gráficos múltiplos no ggplot.

  • post-image

    Fazendo múltiplos gráficos com o ggplot2

    Fazer múltiplos gráficos de acordo com o nível de uma ou mais variáveis categóricas no ggplot2 é fácil: basta utilizar as funções facet_grid ou facet_wrap.

  • post-image

    Alterando a escala dos eixos no ggplot2

    Muitas vezes precisamos mexer na escala de um gráfico - seja para mais ou para menos.

  • Profissão: Estatístico

    Na maioria das vezes que eu dizia que ia cursar (ou que estava cursando) estatística eu via 2 reações: ou as pessoas achavam que era uma área do curso de matemática (“Ah, matemática, legal!

  • post-image

    Facilitando a criação de posters/banners com LaTeX.

    Muitas vezes quando precisamos expor nossos estudos e análises, precisamos fazer em forma de poster ou banner para apresentações em congressos e eventos.

  • Criando classes de objetos e métodos

    Muitos dos objetos que manuseamos no R possuem mais informações do que costumamos ver.

  • Programando no R com Notepad++

    Dentre os vários editores de código existentes (aqui tem uma lista com 10), o que escolhi utilizar foi o Notepad++.

  • Quanto é 0.1 + 0.2 ?

    Antes de mais nada, acho que qualquer um irá concordar que 0.

  • Medindo a semelhança (ou diferença) entre duas palavras distintas

    Há quem diga que, caso existam opções de não se trabalhar com strings, deve-se optar por estas escolhas.

  • Visualizando grandes bancos de dados

    Já comentamos aqui no blog a importância da visualização dos dados antes de se fazer qualquer análise.

  • Importando dados do clipboard (área de transferência)

    Hoje vamos com uma dica rápida e que pode ser útil em algumas situações onde estamos com pressa.

  • Participação nas eleições de 2010

    Todo ano eleitoral é a mesma coisa: partidos/candidatos tentando convencer que são melhores que os adversários, seja mostrando seus projetos/feitos ou criticando os dos adversários.

  • Trabalhando com amostras complexas no R: usando o pacote survey

    Ao contrário da amostra aleatória simples, nos planos amostrais complexos as unidades amostrais (geralmente, pessoas) possuem probabilidades diferentes de serem amostradas quando comparadas com outras unidades amostrais e, devido a isso, todas as análises realizadas sobre amostras complexas devem levar em consideração a probabilidade de cada um dos indivíduos amostrados.

  • Interagindo com o usuário no R

    A interação com o usuário é fundamental em diversos processos, e pode ocorrer de muitas maneiras: desde uma simples janela de Continuar/Parar até a seleção de diversos valores em uma lista.

  • post-image

    Usando o github para hospedar códigos R

    Versionamento de arquivos é uma prática comum entre desenvolvedores de software, e a prática não é difícil de entender.

  • post-image

    Microdados da RAIS

    Dando início à minha série de postagens aqui no Dados Aleatórios, irei falar sobre os microdados da RAIS - Relação Anual de Informações Sociais - disponibilizados pelo Ministério do Trabalho e Emprego.

  • post-image

    A equipe SAS lançará versão gratuita.

    O grupo SAS vai lançar a partir de Maio de 2014 (isso mesmo, no próximo mês) uma versão totalmente free destinada ao estudantes e professores universitários.

  • Review do livro Social Media Mining with R

    Introdução Mídias sociais são o verdadeiro assunto do momento.

  • Como a Visualização de Dados pode nos ajudar?

    Vivemos um momento em que nunca produzimos tanta informação.

  • Contact

    First Name Last Name E-Mail City State AL CA IL Send

  • Sobre o DadosAleatórios.com.br

    Sobre o blog Dados Aleatórios é um projeto que visa divulgar e tornar acessível ao público em geral informações técnicas sobre diversas áreas do conhecimento, em particular, programação e as mais diversas aplicações de estatística.

  • Prefeitura do Rio lança portal sobre dados abertos

    Foi lançado pela Prefeitura do Rio de Janeiro um portal sobre dados abertos e segundo o site são disponibilizados mais de 1200 arquivos com informações sobre a cidade.

  • Aprendendo a usar o argumento '...' no R

    A utilização do parâmetro ’…’ é algo que sempre me gera dúvidas, pois sempre me questiono por qual motivo ninguém nunca me falou sobre antes.

  • Quer aprender a programar em python? Veja aqui 8 dicas que irão lhe ajudar

    Python é uma linguagem de programação muito utilizada por todo o mundo devido a sua simplicidade e apesar de ser interpretada, apresenta um bom desempenho, sendo utilizada amplamente tanto no meio científico quanto no profissional.

  • Esquecendo o PDD e aprendendo a debugar

    Já faz algum tempo em que eu via as pessoas programaram em C++ com a utilização do Visual Studio, famosa IDE da Microsoft.

  • R é a 15ª linguagem mais utilizada, segundo RedMonk

    Segundo o ranking publicado pela RedMonk, a linguagem R ocupa a 15ª posição entre as mais utilizadas.

  • Afinal, quanto ganha um cientista de dados?

    Foi publicado pela O’Reilly um relatório sobre o salário e ferramentas mais utilizadas pelos cientistas de dados.

  • apply, lapply, sapply, tapply, mapply.. Como é que é mesmo?

    Acredito que a esta altura do campeonato todos já devem se questionar sobre a performance do R.

  • Entendendo as diferentes mensagens de aviso no R

    Comumente ao utilizar funções escritas por terceiros no ambiente R, algumas mensagens de aviso podem ser exibidas com o objetivo de alertar sobre algum acontecimento interno daquela função.

  • post-image

    Ferramentas para criação de tabelas LaTex a partir do R

    Sair do ambiente R para exportar resultados e tabelas nem sempre é uma tarefa fácil, em especial quando deseja-se exportar estes resultados para o ambiente LaTex.

  • Enviando mensagens automáticas para o seu amigo oculto

    O mês de Dezembro passou, e como de costume aconteceram as tão esperadas festas.

  • post-image

    Inserindo tabelas no LaTex de forma dinâmica

    Para aqueles que já trabalharam com geração de números aleatórios, a situação a seguir pode ser rotineira: Você escreve um script e sempre que o executa gera outputs diferentes.

  • post-image

    Integrando R e Julia em um mesmo ambiente

    Já faz algum tempo que muito se fala sobre a performance da linguagem Julia.

  • post-image

    Uma primeira experiência com a linguagem Julia

    Imaginem a seguinte situação: Existe um grilo no jardim e o mesmo pula de forma aleatória.

  • Introdução ao shell code{white-space: pre;} pre:not([class]) { background-color: white; } if (window.