Setembro Amarelo e Data Science: Análise exploratória de suicídios no Brasil e no Mundo

Setembro Amarelo e Data Science: Análise exploratória de suicídios no Brasil e no Mundo

MOTIVAÇÃO

Todos os meses possuem uma campanha de saúde atrelado a uma cor com o objetivo de conscientizar a população sobre os perigos causados por algumas doenças. Para este mês uma das cores destacadas é o amarelo, que tem como objetivo a prevenção ao suicídio.

Particularmente a campanha deste mês chamou-me atenção. Na igreja que frequento tenho notado muitos casos de depressão e ansiedade, em minha Universidade (UERJ) vi episódios ao logo dos anos que levaram ao suicídio de estudantes. Ultimamente tem-se intensificado ainda mais esse distúrbio entre a população e a triste maneira que eles recorrem para escapar desse sofrimento, este cenário registra cada vez mais casos, especialmente entre os jovens.

A disseminação de tal campanha tem sido amplamente divulgada, notei que na Volkswagen Caminhões e Ônibus recebi 2 e-mails acerca dessa conscientização, nas escolas ouvi falar de esforços e na internet também é possível notar em páginas e nas redes sociais debates, campanhas e ações para a conscientização sobre o suicídio.

INTRODUÇÃO

Segundo dados do DataSUS, plataforma do governo federal que concentra informações relativas à saúde no Brasil, as mortes por lesão autoprovocada entre 2011 e 2020 aumentaram 35%. Só em 2020 foram registradas 12.895 suicídios. Em um cenário mundial, esse número ultrapassa 1 milhão de pessoas, levando o suicídio a ser considerado um problema de saúde pública.

Para você ter uma noção da dimensão desses números, saiba que o suicídio tem uma taxa maior do que vítimas de AIDS e da maioria dos tipos de câncer. Segundo a Organização Mundial da Saúde (OMS) em um levantamento de 2012 sobre quantidade de suicídios no mundo, o Brasil ocupava o oitavo lugar, já outro levantamento em 2019 apontava o Brasil como quinto colocado. A saúde mental está negligenciada e os números de suicídios tendem a aumentar proporcionalmente às taxas de ansiedade e depressão. Segundo a OMS, a cada 45 minutos há um suicídio no Brasil, ou seja, 32 pessoas de suicidam por dia no país. A cada 40 segundos há um suicídio no mundo e que a cada 3 segundos há uma tentativa de suicídio.

Setembro Amarelo é uma iniciativa da Associação Brasileira de Psiquiatria (ABP), em parceria com o Conselho Federal de Medicina (CFM), para divulgar e alertar a população sobre o problema.

PROPOSTA DO ARTIGO

O objetivo deste trabalho é realizar análises exploratórias no conjunto de dados sobre suicídio, a fim de entender o comportamento dos dados no Brasil e fazer uma leve comparação com alguns países do mundo.

Unindo os fatores descritos acima, com o curso de Data Science e materiais disponibilizados pelo professor Carlos Melo o que trago neste artigo é muito mais que apenas um artigo de Ciência de Dados. É uma pequena contribuição que visa ajudar a entender a extensão desse problema, além de incentivar a campanha do Setembro Amarelo.

Dataset de dados sobre suicídio

O conjunto de dados aqui utilizados foi encontrados no Kaggle e traz informações sobre vários países. O dataset contempla o período entre os anos de 1985 e 2016. Esse é um compilado de outros 4 datasets. A pessoa que disponibilizou o mesmo fez um grande trabalho de limpeza e padronização.

Dicionário de Variáveis

Para nos ajudar a compreender as informações contidas no dataset, é fundamental criarmos um dicionário de variáveis, apresentando a descrição de cada uma delas.

O arquivo importado possui 12 colunas, as variáveis são:

  • country: país onde os dados foram registrados – 101 países
  • year: ano em que os dados foram registrados - 1987 a 2016
  • sex: sexo considerado no registro
  • age: faixa etária considerada
  • suicides_no: número de suicídios
  • population: população para o grupo
  • suicides/100k pop: número de suicídios por 100 mil habitantes
  • country_year: identificador contendo country + year
  • HDI for year: Índice de Desenvolvimento Humano (IDH) para o ano
  • gdp_for_year: Produto Interno Bruto (PIB) para o ano
  • gdp_per_capita: Produto Interno Bruto (PIB) per capita

Análise Exploratória dos Dados

Como mencionei acima, este arquivo recebeu um tratamento anterior que facilitará muito a nossa análise. A partir do conhecimento inicial do dataset, podemos extrair algumas informações básicas desse conjunto de dados.

O dataset contém 27.820 linhas e 12 colunas. Como você pode ver abaixo, os dados podem ser agrupados por vários critérios como país, ano, sexo e idade.

Não foi fornecido texto alternativo para esta imagem

ANÁLISE MUNDIAL

Agora uma rápida visão sobre o comportamento de suicídios ao redor do mundo. Aqui podemos ver os países que países apresentam os maiores números de casos de suicídios em todo o mundo no período de 1985 até 2015.

Os números mais impressionantes são os da Rússia, Estados Unidos da América e Japão, que apresentam, pelo menos, duas vezes mais casos de suicídios do que o restante dos países listados. O Brasil aparece na lista como o 8º país com mais casos no período analisado.

Não foi fornecido texto alternativo para esta imagem

ANÁLISE BRASIL

Para facilitar a manipulação de informações de nosso país é ideal que se separe os dados do Brasil criando um dataset a parte. No período identificado há 372 casos registrados. Abaixo é possível ver as 5 primeiras e 5 ultimas entradas. Percebe-se  que  os  dados  vão  até o ano de 2015.

Não foi fornecido texto alternativo para esta imagem

Tendência da taxa de suicídio no Brasil

Uma primeira comparação que farei diz respeito ao número de suicídios cometidos no Brasil por 100 mil habitantes, e a tendência do gráfico em relação à taxa mundial.

Para ver a tendência, é melhor sempre usar essa relação por 100 mil, pois a população do país cresceu muito de 1985 para 2015. Se formos comparar em termos absolutos, poderemos tirar conclusões erradas ou distorcidas.

Não foi fornecido texto alternativo para esta imagem

Nota-se que apesar da taxa de suicídios no Brasil ser menor que a média mundial, ela vem crescendo ao longo dos 30 anos. O Brasil apresenta um slope positivo ao logo de todo período. O comportamento indica que não estamos acompanhado a taxa mundial.

Faixa etária com índices de suicídio no Brasil

Foi criada uma tabela dinâmica para analisar as 6 faixas etárias em função do ano e do número de suicídios por 100 mil habitantes. O principal objetivo é identificar qual a faixa etária que tem a maior representatividade entre aqueles que tiram a própria vida, e identificar se houve alguma mudança no perfil ao longo de 30 anos.

Não foi fornecido texto alternativo para esta imagem
Não foi fornecido texto alternativo para esta imagem

Analisando os dados de 2015 é possível perceber que o grupo de pessoas que mais cometem suicídio está entre 35-54 anos. Em segundo lugar, estão pessoas entre 25-34 anos de idade. Juntos, esses dois grupos correspondem a quase 60% dos registros. Esse comportamento se mostra geral comparando com o somatório dos anos anteriores.

Não foi fornecido texto alternativo para esta imagem

Um outro ponto a ressaltar é o aumento de casos entre pessoas acima de 55 anos. Em 1985, as pessoas com mais idade representavam uma pequena fatia do número total.

Entretanto, em 2015 é nítido que mesmo para pessoas acima de 75 anos houve um incremento significativo no número de suicídios. Para se inferir a causa dessa mudança de padrão, é necessário se avaliar mais profundamente questões que vão além dos números (como exemplo, fatores qualitativos, momento econômico do país e a cultura dominante de cada época).

Taxa de suicídio entre homens e mulheres

Analisando-se todo o período, o dataset utilizado mostrou que aproximadamente 78% dos casos foram cometidos por homens e 22% deles por mulheres. Optou-se por pegar a média dos 30 anos, pois não houve mudança significativa desse comportamento durante o período.

Não foi fornecido texto alternativo para esta imagem

Importante: Na base de dados utilizada, não foi encontrada uma variável que pudesse especificar se a pessoa que morreu de suicídio se identificava como cis ou como trans.

Correlações entre o PIB, IDH e número de suicídios

Criando uma matriz de correlação e plotando um heatmap, infere-se que o aumento no PIB per capita não diminuiu o número de suicídios por 100 mil habitantes. Na verdade, ele se manteve estável, contrariando o senso comum da maioria das pessoas.

Não foi fornecido texto alternativo para esta imagem

Em relação ao IDH, como foi mencionado anteriormente, há muitos valores ausentes nas células, o que pode dar uma interpretação incorreta ou com viés.




CONCLUSÕES

  • Em termos a cada 100 mil habitantes o Brasil é o 8º país com mais suicídios.
  • Enquanto o mundo está conseguindo diminuir as taxas de suicídio, o Brasil enfrenta dificuldades para evitar o crescimento ano após ano.
  • Um dos alertas para a sociedade é a alta taxa de suicídio entre idosos com mais de 75 anos.
  • Dentre as vítimas no Brasil: 78.4% são Homens; Faixa etária de 35–54 anos (37,15%) e 25–34 anos (21.16%);
  • Em relação ao PIB e a taxa de suicidio no Brasil podemos confirmar que não há uma forte correlação a respeito dos dois fatores.

CONSIDERAÇÕES

O que quis trazer neste artigo foi um projeto de análise de dados visando conscientizar as pessoas sobre a real importância de um problema tão latente nos dias atuais.

O conjunto de dados usados aqui é simplificado, porém ideal para uma abordagem inicial, para se criar uma consciência situacional a respeito do tema.

Há diversas iniciativas dentro do campo da Inteligência Artificial visando não apenas a conscientização, mas também prevenção de suicídios. Uma das mais populares diz respeito à análise de postagens em redes sociais, onde algoritmos de Machine Learning são capazes de identificar potenciais suicidas e alertar outras pessoas.

A campanha é em setembro, mas falar sobre prevenção do suicídio em todos os meses do ano é fundamental

Espero que este artigo tenha trazido um pouco de conhecimento e alertado você sobre um problema tão sério. Lembre-se que não é frescura e que ninguém está querendo aparecer. Na verdade, a gente nunca tem a mínima ideia do que a outra pessoa está passando. Qualquer atitude que você tenha que possa contribuir para a prevenção do suicídio, pode significar uma vida a mais ;)

PROJETOS FUTUROS

Para a campanha de Setembro Amarelo do ano que vem ou para as próximas campanhas deste ano pretendo utilizar os Dados do DATASUS e tentar ter/extrair informações mais precisas e em maior quantidade. Seria interessante avaliar os impactos da COVID-19 e fatores econômicos de 2010 até anos mais recentes;

Outra análise interessante seria avaliar as taxas de suicídio pelas gerações;

Mais pontos que poderão ser levantado é a comparação em relação à raça/cor, profissões, tipo de suicídio, tentativas de suicídio e regiões que mais possuem casos.

Em projetos futuros pretendo trabalhar em regimes de regiões: Resende, Sul Fluminense, Rio de Janeiro, Brasil, América Latina e Mundo.

REFERÊNCIA BIBLIOGRÁFICA

Significado das cores do mês

Brasil lidera ranking de depressão e suicidio na América Latina

Brasil 8° país com mais suicídios no mundo

Casos de suicídio no Brasil

Análise exploratória de dados

A análise detalhada com passo-a-passo a partir do qual esse artigo foi escrito pode ser encontrada em maiores detalhes no meu Portfólio no GitHub através do link: Setembro Amarelo: Análise exploratória dos dados de suicídio no Brasil.

Carlos Luert

Product Analyst | Lighting and Components | Semcon | Volkswagen Truck and Bus

2 a

Interessante. Os dados estão aí, pra mostrar e conscientizar a sociedade sobre esse tema que é muito importante. Ótima contribuição pra rede!

Entre para ver ou adicionar um comentário

Outros artigos de Jardel Vieira

Outras pessoas também visualizaram

Conferir tópicos