Microdados da RAIS

Dando início à minha série de postagens aqui no Dados Aleatórios, irei falar sobre os microdados da RAIS - Relação Anual de Informações Sociais - disponibilizados pelo Ministério do Trabalho e Emprego. A RAIS é, como o nome já diz, uma relação de informações que todo empregador é obrigado a informar anualmente sobre os seus trabalhadores do ano base (ou seja, inclui quem foi demitido). Essas informações vão desde informações trabalhistas (tempo de serviço, salário recebido, motivos de licenças/demissão, entre outras) até informações pessoais (idade, escolaridade, raça/cor).



Os dados podem ser baixados nesse link do Drive ou do Skydrive a partir do ano de 2007 por estado (maiores informações a respeito dos dados podem ser encontradas no site do MTE). Apesar de estarem salvos como .TXT, eles na realidade são arquivos .CSV e podem ser lidos usando os códigos desta postagem do meu antigo blog.

As possibilidades de análises são inúmeras. Por exemplo, é possível comparar a mediana salarial por raça e grau de escolaridade.

INDIGENABRANCAPRETAAMARELAPARDA
ANALFABETO992,94881,99859,241.101,97880,79
ATE 5.A INC954,90986,65913,98917,06965,60
5.A CO FUND1.002,021.024,24949,35969,431.015,07
6. A 9. FUND1.012,431.013,99926,00946,49955,33
FUND COMPL1.022,921.038,05943,181.034,251.013,15
MEDIO INCOMP 975,32939,29888,51923,45906,54
MEDIO COMPL1.113,281.099,331.040,891.018,551.101,37
SUP. INCOMP1.406,091.485,391.329,051.393,451.433,89
SUP. COMP2.323,272.690,941.983,703.018,742.487,59
MESTRADO3.244,964.034,552.782,443.778,043.204,21
DOUTORADO1.720,089.213,154.135,4412.651,555.499,99

Outro exemplo interessante é a comparação da mediana salarial por sexo e grau de escolaridade.

MasculinoFeminino
ANALFABETO926,16765,36
ATE 5.A INC1.084,91850,04
5.A CO FUND1.146,35874,40
6. A 9. FUND1.142,91858,43
FUND COMPL1.188,81864,44
MEDIO INCOMP 1.070,65830,48
MEDIO COMPL1.287,06967,02
SUP. INCOMP1.854,661.310,38
SUP. COMP3.778,282.050,77
MESTRADO4.655,483.587,15
DOUTORADO8.614,787.627,01
É possível ainda criar mapas com os dados utilizando as malhas digitais fornecidas pelo IBGE. Os únicos cuidados que devem ser tomados é com qual variável de localidade é a de interesse (o município onde a empresa é registrada ou o município onde o trabalhador trabalha) e remover o último dígito dos código de município da malha do IBGE, pois o MTE não utiliza o digito verificador. Um exemplo de mapa é a mediana salarial por município e por sexo.
Pessoal de Candiota ta ganhando bem!

Uma outra analise que fiz foi a comparação do tempo de licença por doença ou acidente de trabalho entre professores da rede pública e professores da rede privada. Em 2012 o RS possuia 20.992 vínculos celetistas e 151.495 vínculos estatutários (note que uma mesma pessoa pode contar mais de uma vez e nas duas categorias). Dos celetistas, 4,19% (880) tiveram algum tipo de afastamento, enquanto nos estatutários esse percentual sobe para 12,84% (19.459). Já quando analisamos a mediana do tempo de afastamento, os estatutários apresentam valor inferior (15 dias) quando comparado com os celetistas (60 dias). Parte desse resultado pode ser explicado pelo grande número de licenças pequenas (menores que 5 dias) tiradas pelos professores estatutários. Geralmente, faltas pequenas podem ser abonadas pela chefia imediata nos setores públicos, mesmo sem a apresentação de atestados. Abaixo é possível ver a distribuição da duração dos afastamento por tipo de vínculo.




Claro que as análises aqui foram superficiais, apenas para exemplificar possíveis análises com o banco. Um co-variável importante e que não foi utilizada no estudo do afastamento é a idade dos funcionário, que difere nos 2 tipos de vínculo (A idade média dos estatutários é 4,5 anos maior que dos celetistas). Como sempre, os códigos utilizados aqui estão disponíveis no meu Drive. Dúvidas, críticas e sugestões são bem vindas!

5 comentários:

  1. Fiquei intrigada com valores de salários para os declarados amarelos. Qual o total de pessoas nesse grupo?

    ResponderExcluir
  2. Sim Aisha, os salários deles são realmente maiores que das demais raças. Já utilizei a mediana para tentar diminuir o efeito de valores muito grandes, mas em algumas cidades pequenas permaneceu alto o valor. Seguem as frequências:

    ANALFABETO 76
    ATE 5.A INC 144
    5.A CO FUND 188
    6. A 9. FUND 590
    FUND COMPL 895
    MEDIO INCOMP 627
    MEDIO COMPL 2397
    SUP. INCOMP 309
    SUP. COMP 474
    MESTRADO 15
    DOUTORADO 9

    ResponderExcluir
  3. Deve ter algum efeito dessas poucas pessoas buscarem colocações que dentro da escolaridade delas pague mais. Por exemplo, os doutores podem ser professores universitários com bolsas de pesquisa de produtividade e comparando com os brancos, onde tem professores com doutorado ganhando somente o salário inicial.

    ResponderExcluir
  4. Nos microdados há informações por setor censitário ou área de ponderação?

    ResponderExcluir
  5. Nos microdados há informações por setor censitário ou área de ponderação?

    ResponderExcluir