Poder Preditivo de Métodos Clássicos e de Statistical Machine Learning na Classificação de Dados Desbalanceados em Seguros

Lucas Pereira Lopes

Resumo


A mensuração de diversas fontes de riscos para instituições financeiras se encontra diante de uma situação favorável, tanto pelo avanço computacional e consequentemente dos mais variados modelos, quanto pelo grande número de variáveis disponíveis. Especialmente dentro do universo das seguradoras, a classificação de clientes propensos a obterem sinistro é uma tarefa essencial para o processo de precificação e no controle econômico e financeiro da instituição. Dado a quantidade de clientes cadastrados em uma seguradora é essencial o desenvolvimento de classificadores automáticos para realizar tal classificação. Porém, técnicas de predições tradicionais possuem baixo poder preditivo quando o conjunto de dados são desbalanceados, ou seja, uma classe é predominante em relação a outra. Portanto, este trabalho tem por objetivo realizar seis modelos de classificação que levam em conta o desbalanceamento dos dados por meio de duas metodologias diferentes e compará-los com os métodos usuais no processo de classificação de clientes que obtiveram sinistros (Y = 1) e os que não obtiveram (Y = 0). Foi utilizado diversas métricas para a comparação da qualidade dos métodos. Como resultado, confirma-se empiricamente a necessidade da inclusão de metodologias que levam em consideração o desbalanceamento presente nos dados, onde neste estudo ficou evidente que a metodologia de mudança de corte trouxe melhores resultados do que a metodologia de sobreamostragem. Além disso, as metodologias concordaram na maioria das vezes em suas predições e em quais variáveis que impactam a ocorrência de sinistro ou não.


Texto completo:

PDF

Apontamentos

  • Não há apontamentos.


Programa de Pós Graduação Mestrado Profissional e Doutorado em Administração - PPGA