Uma nova maneira de ler dados externos

Há cerca de 2 anos atrás postei uma pergunta no StackOverflow (caso não conheça, leia esta postagem nossa) perguntando como podia fazer para ler grandes bancos de dados, de cerca de 600mb - esse era meu primeiro contato com bancos grandes, provenientes do Censo Escolar. Das duas respostas dadas na época, a que mais me agradou usava o pacote sqldf, que utiliza SQL para fazer a leitura e manipulação de fontes externas de dados.

Há pouco mais de 1 mês um usuário postou uma nova resposta à pergunta, utilizando o pacote readr. O pacote é um dos muitos pacotes criados/mantidos por Hadley Wickham - que criou, além desse e do ggplot2, mais de 50 pacotes para o R - o que significa que vale a pena dedicarmos um tempo para estudarmos o pacote.

O pacote possui sua própria versão dos comandos read.delim() (e, de quebra, read.table(), read.csv() e read.csv2()) e read.fwf() - para arquivos de largura fixa (fixed width formated), com sintaxes e nomes praticamente idênticas aos do pacote base - basta trocar o . por _ na função. Além do ganho de velocidade frente à outros pacotes disponíveis (link - note que há referência a mais um pacote do Hadley, o stringi), vale a pena destacar dois pontos : 1) ele possui uma progressbar (não funciona muito bem no Windows, mas está la!); 2) nos arquivos de largura fixa é possível ler somente as variáveis de interesse, e não todo o banco.

E você, utiliza outro pacote do Hadley, ou conhece algum pacote que valha a pena ‘perder tempo’ estudando? Tem sugestão de outros pacotes que merecem uma postagem? Deixe seu comentário!