Econometria – Ciências Atuariais e Dados em Painel.
Gujarati. D, Econometria - Princípios, Teoria e Aplicações Práticas. Saraiva-Somos-SP

Econometria – Ciências Atuariais e Dados em Painel.

Quando se fala em Interdisciplinaridade está se falando em combinar o conhecimento e as técnicas de diversas áreas do saber com a finalidade de explicar algum fenômeno em comum.

A Econometria se vale de técnicas estatísticas para explicar fatos econômicos. A Ciência Atuária estuda em grande parte todos os fenômenos ligados a risco (desde o risco financeiro, risco de seguros de vida e de saúde) e para isto também se vale de técnicas de estatística.

Ora, poderíamos pensar que se duas estradas convergem para uma terceira então devem existir aplicações ou estudo de fenômenos comuns.

Neste artigo, vou tentar explicar como pode ser estabelecido (não existe uma única forma) um modelo de regressão linear múltipla, aplicada a uma base de dados organizados em “ corte longitudinal” ou “dados empilhados”, pode nos auxiliar a gerenciar e projetar custos com internações num hospital. Alerto que não vou estabelecer ou quantificar o risco de morte de um paciente.

Para estabelecer esse modelo, é necessário utilizar uma técnica de organização dos dados chamada de “dados em painel” de maneira bem simples.

O que são dados em painel?

É uma forma de organizar as amostras a fim de determinar um modelo preditivo para determinado fenômeno. Essa forma de organização também é chamada de: dados empilhados ou dados em corte longitudinal sendo preferida por muitos analistas pois combina duas dimensões (características) muito importantes numa pesquisa. A primeira é a característica de uma série temporal, ou seja, a anotação de uma variável em intervalos regulares e repetidos de tempo. A segunda é a possibilidade de que essa anotação pode ser feita para mais de um objeto de análise e ao mesmo tempo para várias variáveis simultaneamente.   

Não foi fornecido texto alternativo para esta imagem

Nessa forma de organização de dados estão combinadas as duas dimensões: o tempo e as variáveis com a clara vantagem sobre uma única série temporal simples que combina apenas 1 variável ao longo do tempo.

Devido ao fato que os dados secundários de que precisamos não são encontrados facilmente na internet, recorremos a bancos de dados internacionais de um país onde os dados são disponibilizados e encontrados com maior facilidade. O software utilizado desta vez será o programa Econométrico Stata 12 para que pudéssemos mostrar abaixo o aspecto geral da base de dados.

Por que utilizar dados em painel?

Uma das razões é a forma de organização das amostras colhidas de forma repetida e com várias variáveis, quase sempre se refere a fenômenos cuja disponibilidade de informação é limitada. Ao contrário, uma série temporal Univariada normalmente possui muito mais observações colhidas ao longo do tempo.

O problema ilustrado neste artigo.

Alerta-se que este artigo não é uma adaptação tampouco um plágio do artigo dos autores mencionados na base de dados. Os resultados atingidos neste exemplo diferem totalmente em valor e em finalidade da problemática e objetivo apresentados por aqueles uma vez que nem todas as variáveis foram utilizadas aqui. Foi utilizada a base de dados secundários existente e a nova problemática e objetivo foi idealizado pelo autor deste artigo.  

Um caso hipotético

Suponha que você é um analista atuarial (risco) e que sua organização governamental gerencia planos de saúde de abrangência nacional bem como seus custos. Sua organização governamental reembolsa aos estados pelos custos gerados pelos segurados hospitalizados e os estados reembolsam os planos de saúde.  Sabe-se que os governos pagam pelo custo médio diário.

Devido a impossibilidade de controlar todos os planos de saúde, médios e pequenos, a sua organização governamental toma por base os custos gerados pelo maior plano de saúde do País (Medicare) e estima o total geral do sistema de saúde nacional a partir desse plano. Estima-se que haja uma correlação positiva entre os custos do maior plano e os custos totais de cada estado.

Sua intenção é estimar um modelo que o ajude a controlar os custos totais que os estados irão gerar para o sistema de saúde nacional do governo.

Esse modelo poderia ainda auxiliá-lo a controlar se determinado estado está próximo de superar seu orçamento previsto e determinar qual é o estado que mais gasta com esses reembolsos e, portanto, o mais arriscado para o sistema como um todo?

Poderíamos calcular uma equação de custos por estado, mas queremos estabelecer um único modelo para tentar controlar os custos totais do sistema como um todo tomando por base os custos gerados pelo maior plano de saúde do país.

Este exemplo supõe que o sistema de saúde Norte Americano funcione dessa forma e assim mostrar o propósito da regressão para dados em painel (empilhados).

 A variáveis.

Não foi fornecido texto alternativo para esta imagem

A base de Dados

Não foi fornecido texto alternativo para esta imagem

Note o leitor que a base de dados está organizada como dados em Painel ou empilhados de 6 anos para cada um dos 54 estados americanos da federação.

A Regressão para Dados Empilhados.

Lembra-se que se espera estimar os custos totais do sistema previdenciário governamental a partir dos custos que o maior operador gera para o governo.

Não foi fornecido texto alternativo para esta imagem

Utiliza-se a variável TOT_CHG como dependente e as variáveis explicativas (Regressores) serão COV_CHG ; MED_REIB ; TOT_D e AVE_T_D.

Não foi fornecido texto alternativo para esta imagem

Aciona-se o botão Panel settings para especificar e atestar para o STATA 12 que se trata de dados em painel e especificar qual variável é o controle do período, neste caso 6, portanto, a variável Year e a variável de identificação será a que leva a sigla de cada estado. Não entraremos em considerações de construção como por exemplo, regressão de efeitos fixos ou aleatórios nem nenhum outro cujos pressupostos e variações podem ser encontrados em livros de Econometria nas explicações de modelos de regressão para dados em painel.

Não foi fornecido texto alternativo para esta imagem

Clica-se OK e OK nos dois quadros anteriores para se obter o quadro com os Coeficientes do modelo.

Não foi fornecido texto alternativo para esta imagem

O Modelo

Não foi fornecido texto alternativo para esta imagem

Considerações Finais (mas não únicas)

Dessa maneira, se por exemplo, num estado onde a filial do plano de saúde de referência tem uma cobertura em planos (valores segurados aos clientes) no valor de  99.000.000 Unidades Monetárias , e teve um total de Reembolsos Médicos de 67.200.000  U.M, e teve um total de 57.672 dias de hospitalização no sistema estatal como um todo e uma permanência média em dias até a Alta Hospitalar de 7 dias, esse estado irá gerar uma despesa ao sistema de saúde no montante de 75.874.565,56 Unidades Monetárias previstas no ano.

A partir deste valor pode-se comparar o gasto previsto com o orçamento atribuído e controlar se este tiver sido superado ou próximo de ser superado.

Logicamente esta situação reflete uma visão estática que deve ser atualizada na medida em que os valores reais de gastos governamentais venham sendo realizados.

Deixa-se como sugestão ao leitor construir outros modelos que propiciem simulações semelhantes tomando por base o presente exemplo.

Bom estudo.

Entre para ver ou adicionar um comentário

Outras pessoas também visualizaram

Conferir tópicos