Problemas com a fauna de fatores (Zoo Factor)
Semana passada, na página da Kadima Asset Management falamos sobre um artigo que mostrava como tem crescido o número de fatores publicados na academia desde a década de 60 até 2018.
Os autores dete artigo, Campbell R. Harvey e Yan Liu, trazem também alguns problemas relacionados ao aumento dessa "fauna".
#1 - Usualmente os testes realizados para identificar os fatores declaram um nível de significância (tipicamente 5% ou dois sigmas), que em tese representa uma taxa aceitável de falsos positivos. Contudo o calculo na maioria dos casos considera como se um único fator tivesse sido testado, sem fazer a devida correção para considerar os múltiplos testes realizados.
#2 - É possível contar os fatores publicados na academia, mas não os não publicados. Quando um(a) pesquisador(a) percebe que seu trabalho não atende ao nível de significância, e provavelmente nao terá tantas citações, ele(a) precisa decidir se continua ou abandona o trabalho. Levando isto em consideração, não se pode dizer que temos ciência de todos os fatores testados.
#3 - Existem alguns procedimentos estatísticos para ajustar os testes e lidar com o problema 1. Contudo temos aqui um trade-off: ao aumentarmos o rigor exigido nos resultados, invariavelmente acabamos descartando erroneamente fatores que de fato poderiam significar prêmios de riscos.
#4 -Mesmo que saibamos exatamente quantos fatores foram testados, seriamos tolos em aplicar os mesmos ajustes a todos os fatores que forem testados. Não é razoável acreditar que fatores encontrados simplesmente por procedimentos de data-mining têm a mesma relevância de fatores que foram encontrados com uma metodologia científica clássica (primeiro define a teoria que fundamenta a existência do fator, para depois testar).
#5 - Ao considerar os custos de transação (rotineiramente ignorados em publicações acadêmicas) o número de fatores que parecem reais diminui drasticamente.
Você vê ainda algum outro problema relacionado a este aumento de publicações?
Software Developer | Quant Developer | Python | C#| Java | SQL
3 aMuito interessante. Além da crescente quantidade de fatores e a falha em considerar múltiplos testes, tem sido estudado pela academia a (1) falha em replicar esses fatores, (2) falta de robustez à pequenas mudanças nos parâmetros e inputs e (3) falha em performar out-of-sample, apesar dos resultados e estatísticas apresentados in-sample. Outro trabalho interessante divulgado sobre o tema foi feito pela AQR, em que os autores mostram que a crescente quantidade de fatores pode ser clusterizada em 13 temas, i.e. os fatores divulgados podem ser entendidos como versões desses temas. Vale a pena ler!
Investor Relations at Athena Capital Gestão de Recursos | Especialista Convidado at Xpeed School
3 aBem interessante!!