Setembro Amarelo e Data Science: Análise exploratória de suicídios no Brasil e no Mundo
MOTIVAÇÃO
Todos os meses possuem uma campanha de saúde atrelado a uma cor com o objetivo de conscientizar a população sobre os perigos causados por algumas doenças. Para este mês uma das cores destacadas é o amarelo, que tem como objetivo a prevenção ao suicídio.
Particularmente a campanha deste mês chamou-me atenção. Na igreja que frequento tenho notado muitos casos de depressão e ansiedade, em minha Universidade (UERJ) vi episódios ao logo dos anos que levaram ao suicídio de estudantes. Ultimamente tem-se intensificado ainda mais esse distúrbio entre a população e a triste maneira que eles recorrem para escapar desse sofrimento, este cenário registra cada vez mais casos, especialmente entre os jovens.
A disseminação de tal campanha tem sido amplamente divulgada, notei que na Volkswagen Caminhões e Ônibus recebi 2 e-mails acerca dessa conscientização, nas escolas ouvi falar de esforços e na internet também é possível notar em páginas e nas redes sociais debates, campanhas e ações para a conscientização sobre o suicídio.
INTRODUÇÃO
Segundo dados do DataSUS, plataforma do governo federal que concentra informações relativas à saúde no Brasil, as mortes por lesão autoprovocada entre 2011 e 2020 aumentaram 35%. Só em 2020 foram registradas 12.895 suicídios. Em um cenário mundial, esse número ultrapassa 1 milhão de pessoas, levando o suicídio a ser considerado um problema de saúde pública.
Para você ter uma noção da dimensão desses números, saiba que o suicídio tem uma taxa maior do que vítimas de AIDS e da maioria dos tipos de câncer. Segundo a Organização Mundial da Saúde (OMS) em um levantamento de 2012 sobre quantidade de suicídios no mundo, o Brasil ocupava o oitavo lugar, já outro levantamento em 2019 apontava o Brasil como quinto colocado. A saúde mental está negligenciada e os números de suicídios tendem a aumentar proporcionalmente às taxas de ansiedade e depressão. Segundo a OMS, a cada 45 minutos há um suicídio no Brasil, ou seja, 32 pessoas de suicidam por dia no país. A cada 40 segundos há um suicídio no mundo e que a cada 3 segundos há uma tentativa de suicídio.
Setembro Amarelo é uma iniciativa da Associação Brasileira de Psiquiatria (ABP), em parceria com o Conselho Federal de Medicina (CFM), para divulgar e alertar a população sobre o problema.
PROPOSTA DO ARTIGO
O objetivo deste trabalho é realizar análises exploratórias no conjunto de dados sobre suicídio, a fim de entender o comportamento dos dados no Brasil e fazer uma leve comparação com alguns países do mundo.
Unindo os fatores descritos acima, com o curso de Data Science e materiais disponibilizados pelo professor Carlos Melo o que trago neste artigo é muito mais que apenas um artigo de Ciência de Dados. É uma pequena contribuição que visa ajudar a entender a extensão desse problema, além de incentivar a campanha do Setembro Amarelo.
Dataset de dados sobre suicídio
O conjunto de dados aqui utilizados foi encontrados no Kaggle e traz informações sobre vários países. O dataset contempla o período entre os anos de 1985 e 2016. Esse é um compilado de outros 4 datasets. A pessoa que disponibilizou o mesmo fez um grande trabalho de limpeza e padronização.
Dicionário de Variáveis
Para nos ajudar a compreender as informações contidas no dataset, é fundamental criarmos um dicionário de variáveis, apresentando a descrição de cada uma delas.
O arquivo importado possui 12 colunas, as variáveis são:
Análise Exploratória dos Dados
Como mencionei acima, este arquivo recebeu um tratamento anterior que facilitará muito a nossa análise. A partir do conhecimento inicial do dataset, podemos extrair algumas informações básicas desse conjunto de dados.
O dataset contém 27.820 linhas e 12 colunas. Como você pode ver abaixo, os dados podem ser agrupados por vários critérios como país, ano, sexo e idade.
ANÁLISE MUNDIAL
Agora uma rápida visão sobre o comportamento de suicídios ao redor do mundo. Aqui podemos ver os países que países apresentam os maiores números de casos de suicídios em todo o mundo no período de 1985 até 2015.
Os números mais impressionantes são os da Rússia, Estados Unidos da América e Japão, que apresentam, pelo menos, duas vezes mais casos de suicídios do que o restante dos países listados. O Brasil aparece na lista como o 8º país com mais casos no período analisado.
ANÁLISE BRASIL
Para facilitar a manipulação de informações de nosso país é ideal que se separe os dados do Brasil criando um dataset a parte. No período identificado há 372 casos registrados. Abaixo é possível ver as 5 primeiras e 5 ultimas entradas. Percebe-se que os dados vão até o ano de 2015.
Tendência da taxa de suicídio no Brasil
Uma primeira comparação que farei diz respeito ao número de suicídios cometidos no Brasil por 100 mil habitantes, e a tendência do gráfico em relação à taxa mundial.
Para ver a tendência, é melhor sempre usar essa relação por 100 mil, pois a população do país cresceu muito de 1985 para 2015. Se formos comparar em termos absolutos, poderemos tirar conclusões erradas ou distorcidas.
Nota-se que apesar da taxa de suicídios no Brasil ser menor que a média mundial, ela vem crescendo ao longo dos 30 anos. O Brasil apresenta um slope positivo ao logo de todo período. O comportamento indica que não estamos acompanhado a taxa mundial.
Faixa etária com índices de suicídio no Brasil
Foi criada uma tabela dinâmica para analisar as 6 faixas etárias em função do ano e do número de suicídios por 100 mil habitantes. O principal objetivo é identificar qual a faixa etária que tem a maior representatividade entre aqueles que tiram a própria vida, e identificar se houve alguma mudança no perfil ao longo de 30 anos.
Recomendados pelo LinkedIn
Analisando os dados de 2015 é possível perceber que o grupo de pessoas que mais cometem suicídio está entre 35-54 anos. Em segundo lugar, estão pessoas entre 25-34 anos de idade. Juntos, esses dois grupos correspondem a quase 60% dos registros. Esse comportamento se mostra geral comparando com o somatório dos anos anteriores.
Um outro ponto a ressaltar é o aumento de casos entre pessoas acima de 55 anos. Em 1985, as pessoas com mais idade representavam uma pequena fatia do número total.
Entretanto, em 2015 é nítido que mesmo para pessoas acima de 75 anos houve um incremento significativo no número de suicídios. Para se inferir a causa dessa mudança de padrão, é necessário se avaliar mais profundamente questões que vão além dos números (como exemplo, fatores qualitativos, momento econômico do país e a cultura dominante de cada época).
Taxa de suicídio entre homens e mulheres
Analisando-se todo o período, o dataset utilizado mostrou que aproximadamente 78% dos casos foram cometidos por homens e 22% deles por mulheres. Optou-se por pegar a média dos 30 anos, pois não houve mudança significativa desse comportamento durante o período.
Importante: Na base de dados utilizada, não foi encontrada uma variável que pudesse especificar se a pessoa que morreu de suicídio se identificava como cis ou como trans.
Correlações entre o PIB, IDH e número de suicídios
Criando uma matriz de correlação e plotando um heatmap, infere-se que o aumento no PIB per capita não diminuiu o número de suicídios por 100 mil habitantes. Na verdade, ele se manteve estável, contrariando o senso comum da maioria das pessoas.
Em relação ao IDH, como foi mencionado anteriormente, há muitos valores ausentes nas células, o que pode dar uma interpretação incorreta ou com viés.
CONCLUSÕES
CONSIDERAÇÕES
O que quis trazer neste artigo foi um projeto de análise de dados visando conscientizar as pessoas sobre a real importância de um problema tão latente nos dias atuais.
O conjunto de dados usados aqui é simplificado, porém ideal para uma abordagem inicial, para se criar uma consciência situacional a respeito do tema.
Há diversas iniciativas dentro do campo da Inteligência Artificial visando não apenas a conscientização, mas também prevenção de suicídios. Uma das mais populares diz respeito à análise de postagens em redes sociais, onde algoritmos de Machine Learning são capazes de identificar potenciais suicidas e alertar outras pessoas.
A campanha é em setembro, mas falar sobre prevenção do suicídio em todos os meses do ano é fundamental
Espero que este artigo tenha trazido um pouco de conhecimento e alertado você sobre um problema tão sério. Lembre-se que não é frescura e que ninguém está querendo aparecer. Na verdade, a gente nunca tem a mínima ideia do que a outra pessoa está passando. Qualquer atitude que você tenha que possa contribuir para a prevenção do suicídio, pode significar uma vida a mais ;)
PROJETOS FUTUROS
Para a campanha de Setembro Amarelo do ano que vem ou para as próximas campanhas deste ano pretendo utilizar os Dados do DATASUS e tentar ter/extrair informações mais precisas e em maior quantidade. Seria interessante avaliar os impactos da COVID-19 e fatores econômicos de 2010 até anos mais recentes;
Outra análise interessante seria avaliar as taxas de suicídio pelas gerações;
Mais pontos que poderão ser levantado é a comparação em relação à raça/cor, profissões, tipo de suicídio, tentativas de suicídio e regiões que mais possuem casos.
Em projetos futuros pretendo trabalhar em regimes de regiões: Resende, Sul Fluminense, Rio de Janeiro, Brasil, América Latina e Mundo.
REFERÊNCIA BIBLIOGRÁFICA
A análise detalhada com passo-a-passo a partir do qual esse artigo foi escrito pode ser encontrada em maiores detalhes no meu Portfólio no GitHub através do link: Setembro Amarelo: Análise exploratória dos dados de suicídio no Brasil.
Product Analyst | Lighting and Components | Semcon | Volkswagen Truck and Bus
2 aInteressante. Os dados estão aí, pra mostrar e conscientizar a sociedade sobre esse tema que é muito importante. Ótima contribuição pra rede!