Diálogos com o GECE – mercado de trabalho: quebra estrutural?

Prefácio Importante

Caso você não tenha estudado séries de tempo em seu curso (de graduação), este texto vai lhe parecer bastante esotérico e minha pretensão, no caso, não é ser didático. Para ser didático, neste caso, melhor seria escrever um livro ou um artigo. O objetivo aqui é dialogar com o Vitor Wilher, do GECE, sobre um trabalho mais técnico que ele fez.

Agora, se você já fez um curso de graduação em séries de tempo, o texto abaixo deveria lhe parecer simples. Para os que já passaram por isto no mestrado ou no doutorado, bem, o texto abaixo será infernalmente incompleto e simples, para não dizer cheio de problemas.

Como meu objetivo não é agradar gregos e troianos, siga por sua conta e risco.

Tá preocupado com suas chances de emprego?

Recentemente, o Vitor Wilher publicou um texto em seu blog sobre uma suposta quebra estrutural no mercado de trabalho brasileiro. Bem, eu não entendi bem o que ele havia feito, mas, como sempre, pedi os dados para dar uma olhada superficial. Aproveitando um engarrafamento, ele me enviou os dados pelo smartphone. Eis o cabeçalho da planilha.

vitor1

A partir desta planilha, resolvi fazer um breve exercício para ver o que encontraria. Vamos apenas reler alguns trechos do trabalho do Vitor:

Só passei por aqui hoje para deixar um exercício interessante que tenho feito nas últimas semanas. Haveria uma quebra estrutural no jeito de entender o mercado de trabalho brasileiro? Em outras palavras, se antes de 2009 era verdade que menor crescimento (menor geração de vagas) estava correlacionado com o aumento do desemprego, hoje não necessariamente.

As séries de dados relevantes, então, são a Caged e o Desemprego_SA, que são, segundo Vitor:

… o saldo de admitidos e demitidos do Cadastro Geral de Empregados e Desempregados (CAGED/Ministério do Trabalho) e o desemprego dessazonalizado. 

Ok, então se a variável Caged for positiva, o saldo é de mais admitidos do que demitidos. Mas Vitor tem uma preocupação mais específica. Para entendê-la, você tem que ler o comentário dele, no próprio post.

A ideia global do exercício é ver a seguinte cadeia de causalidade:

PIB => GERAÇÃO LÍQ VAGAS => DESEMPREGO_SA => MASSA_SALARIAL => INFLAÇÃO_SERVIÇOS

Especificamente no ramo GERAÇÃO LÍQ VAGAS => DESEMPREGO_SA a ideia básica era ver se existe alguma relação entre CAGED e PME. A série do CAGED que lhe enviei é a média móvel de 12 meses do saldo entre admitidos e demitidos, fornecido pelo ministério do trabalho, logo envolve apenas trabalho formal. A média móvel se faz necessária porque o saldo original tem oscilações bruscas, principalmente nos meses de dezembro, por questões óbvias.

(…)

Mas ignorando isso, em um primeiro momento, algo que me chamou atenção foi essa diminuição da correlação entre as duas séries, em nível. Como tenho estudado a PNAD, PNAD Contínua e PME de forma mais apurada esse ano, sei que a PEA tem se reduzido bastante. Sendo o desemprego hoje essencialmente explicado por redução da procura por emprego (e não por crescimento), parece ser essa a raiz da explicação para a redução da correlação entre as séries de geração líquida de vagas (CAGED) e o desemprego.

Em palavras outras, mesmo com a redução da média móvel do CAGED, de 190 mil no final de 2010, para 60 mil esse ano, o desemprego não subiu. Pelo contrário, diminuiu. Ao que parece, a redução do crescimento da PEA gerou uma mudança na dinâmica do mercado de trabalho. (…)

Bom, percebe-se que o problema envolve um pouco mais de variáveis do que apenas estas duas. Minha proposta, aqui, é fazer uma análise mais simples destas duas séries e subsidiar o trabalho do Vitor com mais um pouco de descrição destes dados. O que vem a seguir, portanto, é apenas um exercício estatístico, sem maiores preocupações teóricas (este negócio de CAGED, PNAD, PME não é comigo…).

Senta que lá vem análise de dados!

Primeiramente, importei os dados, chequei se estava tudo ok e construí as séries de tempo. Construí uma matriz com os dois vetores (renomeados para caged desemp_sa), obtendo a interseção das duas séries (isto pode ser útil quando elas têm comprimento diferente, mas não foi o caso aqui). Obviamente, gerei um gráfico para visualizar ambas as séries antes de fazer qualquer coisa. Abaixo estão o trecho inicial do meu script em R e o primeiro gráfico.

# dados_caged.xls

base <- read.table(file = "clipboard", sep = "\t", header=TRUE)
head(base)
caged<-ts(base$Caged, start=c(2003,1))
desemp_sa<-ts(base$Desemprego_SA, start=c(2003,1))
data=ts.intersect(caged,desemp_sa)
plot(data)

vitor1

Pois é. Enquanto o desemprego (dessazonalizado) parece apresentar uma (quase linear) tendência de queda, o tal caged tem um comportamento mais irregular. A primeira preocupação seria verificar se estas séries possuem raiz unitária (e quantas). Para isto, usei o pacote forecast do R e usei um comando, ndiffs, aplicando o default do teste ADF. Para 5%, encontrei que ambas as séries teriam apenas uma raiz unitária o que, para os menos iniciados, é um sinal de que deveríamos trabalhar com a primeira diferença das séries em análises como a de um teste de causalidade Granger. Seguem os comandos deste trecho.

library(forecast)

ndiffs(caged, alpha=0.05, test=c("adf"))
ndiffs(desemp_sa, alpha=0.05, test=c("adf"))
# a 5%, ambos têm uma raiz unitária.

Bom, o Vitor encontrou que o caged seria I(0) e o desemprego_sa, I(1). Em outras palavras, apenas a última teria uma raiz unitária. De qualquer forma, vou analisar as correlações das duas séries no caso em que são ambas I(1) e, como ele, uma sendo I(0) e outra sendo I(1).

library(astsa)
lag2.plot(diff(caged),diff(desemp_sa),12,corr=TRUE)
lag2.plot(diff(desemp_sa),diff(caged),12,corr=TRUE)</pre>
<pre>lag2.plot(caged,diff(desemp_sa),12,corr=TRUE)
lag2.plot(diff(desemp_sa),caged,12,corr=TRUE)</pre>
<pre>

Os gráficos desta parte do exercício estão reproduzidos a seguir.

vitor2

vitor3

Neste primeiro conjunto de gráficos acima, vemos que as variações no caged são correlacionadas com as variações no desemprego, mas de forma diferente quando observamos as defasagens no tempo. Por exemplo, no primeiro conjunto de gráficos, vemos que o desemprego de um mês (t) está mais fortemente relacionado com o caged de dois meses antes (t-2), de forma negativa (o valor da correlação é -0.22).

Já na parte inferior deste conjunto, vemos uma variação do desemprego em t-13 correlacionada em 0.28 com a variação atual do caged.

Em outras palavras, temos dois pontos interessantes aqui: quando observamos duas séries de tempo, podemos observar correlações não apenas instantâneas (no mesmo período de tempo), mas também entre diferentes períodos de tempo e, obviamente, elas não precisam ter o mesmo valor. O segundo ponto é que não existe necessariamente simetria superficial entre as correlações: o que você encontra para X(t) e Y(t-1) não será necessariamente igual ao que você encontra para Y(t-1) e X(t).

Do ponto de vista do Vitor, as observações interessantes estariam nos dois conjuntos de gráficos que se seguem.

vitor4

vitor5

Pois é. Mas Vitor fez também um exercício de causalidade por meio de um teste de Causalidade de Granger. Eu vou seguir este exercício, mas considerando ambas as variáveis estacionárias. Em outras palavras, farei o exercício entre as variáveis em diferença.

A primeira coisa é verificar o número de defasagens da matriz. Por uma destas mágicas do destino, todos os critérios de informação nos deram três defasagens e, portanto, nem prossegui para algum tipo de comparação (com aqueles testes LR) porque não havia, simplesmente, nada para se comparar com o único VAR apontado pelos critérios (mas é claro que você poderia se questionar sobre isto…). Eis os comandos.

library(vars)

VARselect(data,lag.max=12, type=c("const"),season=NULL)

# assim, vamos de tres:

grangertest(diff(caged)~diff(desemp_sa),order=3, data=data)
grangertest(diff(desemp_sa)~diff(caged),order=3, data=data)

Finalmente, os resultados dos testes.

vitor6

A hipótese nula é a de que a inclusão de defasagens da outra variável não ajuda na previsão da variável dependente. Então, na parte superior da janela de resultados, vemos que a inclusão da variação do desemprego não ajuda na previsão da variação do caged (o p-valor é de 0.6194). Já na parte inferior da tabela, vemos que a variação do caged ajuda na explicação da variação do desemprego. Em outras palavras, este é o mesmo resultado que Vitor encontrou, embora ele tenha feito o teste para variáveis com ordens de integração diferentes, algo que não vejo como uma boa idéia. Pelo menos não sob o protocolo que estamos seguindo.

Agora, acabou? 

Na verdade, não. Embora eu tenha feito o teste de causalidade de Granger para o leitor ter uma idéia da comparabilidade dos resultados com os do Vitor, o fato é que o teste não precisaria ser feito. Por que? Porque ele fala em quebra estrutural no sistema de variáveis analisado e, além disso, ele analisa apenas duas das variáveis de seu sistema, o que gera um viés (imagino que exista e que não seja desprezível) de omissão de variáveis (e de suas defasagens…). Também há a questão da cointegração, é bom lembrar.

Quanto à quebra estrutural, bem, este é um ponto central no argumento do Vitor, mas falar dela sem analisar mais cuidadosamente o problema é complicado. Afinal, se há mais de duas variáveis, é preciso analisar com calma questões de exogeneidade das mesmas, bem como a de raízes unitárias. Por exemplo, considerando a hipótese de que existam quebras estruturais na relação na relação em que variações no desemprego são causadas por variações no caged (que é a relação que emergiu do teste de Granger, não?), um teste simples (existem vários, claro) não mostra qualquer ponto de quebra na relação. Eis o trecho do script com os comandos.

library(strucchange)

fs.vitor <-breakpoints(diff(desemp_sa)~diff(caged), data=data)
reg<-lm(diff(desemp_sa)~diff(caged))
breakpoints(fs.vitor)

Diante destes resultados, fica difícil saber se existe alguma quebra estrutural. Minha primeira reação, naturalmente, seria dizer: não, não existe. Entretanto, como falei, há dois pontos importantes para serem analisados, antes de qualquer avanço neste trabalho. Primeiramente, a questão do número de raízes unitárias em cada série (o que pode ter implicações em termos de cointegração, por exemplo). Em segundo lugar, o número de variáveis no sistema. Caso a análise do Vitor tenha que levar em conta umas cinco variáveis, então não podemos analisar apenas duas delas, exceto se houver algum grau de exogeneidade entre sub-conjuntos (ou blocos) de variáveis do sistema.

Uma resposta em “Diálogos com o GECE – mercado de trabalho: quebra estrutural?

  1. Pingback: Diálogos com o Nepom: quebra estrutural no mercado de trabalho? | Análise Macroeconômica

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s