Data Science: analisando a violência no Rio de Janeiro
Com o objetivo de apresentar informações sobre a violência no Rio de Janeiro ao longo dos anos de 1991 à 2019, desenvolvi um projeto que pode ser acessado através do link: violência_RJ.
O Rio de Janeiro é considerado um dos principais pontos turísticos do Brasil por nele pertencer uma das sete maravilhas do mundo, o Cristo Rendentor, além de praias exuberantes como a de Copacabana e Ipanema. Outro detalhe é a rica composição cultural e histórica que pode ser encontrada nos museus e teatros das cidades.
Apesar de tudo isso, o que mais aparece nos noticiários não são sobre as belezas do Rio, mas sim, sobre a violência que é praticada diariamente, assustando moradores e visitantes, além de causar enormes prejuízos.
Com isso, o governo do estado do Rio de Janeiro, disponibiliza através do site do ISP informações sobre grande parte dos crimes registrados, assim como um dashboard interativo para melhor identificar violências por áreas de segurança pública.
A partir de um dataset de 344 entradas e 56 variáveis, foram desenvolvidas as seguintes análises:
O histograma acima nos mostra que a maior concentração de homicídios dolosos está entre 500 e 550 ao longo dos anos, com um média de 505 por mês, sendo representada pela linha vermelha.
O gráfico de linha acima, apresenta os valores de roubo em coletivo do mês de janeiro de 1991 com valor de 381, ao mês agosto de 2019, com um valor de 1215. Com isso percebemos o grande aumento desse crime.
Como podemos observar, o índice de apreensão de drogas manteve-se nivelado entre os anos de 1991 à 1994, a partir dai, os valores aumentaram constantemente, sendo que a maior quantidade de apreensão de drogas foi aproximadamente 29.000 no ano 2015.
O indicador roubo de rua é composto pelos títulos roubo a transeunte, roubo de aparelho celular e roubo em coletivo. E com base no gráfico acima, tal indicador manteve-se constante entre os anos de 1991 à 1999, a partir do ano 2000 houve um crescimento significativo em relação a esse fato. Tendo como maior destaque, o ano de 2018, acumulando 135.000 indicadores desses roubos.
A intenção de ter elaborado esse gráfico, era verificar se no principal período de férias (Dezembro, janeiro e julho), teria um aumento no índice de roubo a residência. Com isso, evidencia-se que o mês de janeiro tem um valor intermediário com base na distribuição dos valores gerais, havendo uma maior intensidade de roubo a residência no mês de março, talvez por conta do feriado de carnaval, cuja várias famílias viajam. A partir do mês de junho, os índices desse roubo diminuem, comparado ao primeiro semestre do ano.
Analisando os diversos tipos de roubos presente na bases de dados, podemos destacar que no Rio de Janeiro, a maior ocorrência se dá pelo roubo transeunte (caracterizado por assalto a indivíduos que são abordados enquanto transitam em vias públicas com subtração de pertences de forma violenta). Na sequência temos roubo de veículos com alto índice de ocorrência. O que de fato são, os mais caracterizados em notícias de jornais.
Vale ressaltar que os valores dispostos para o ano de 2019 tem sempre uma queda em relação à 2018, pois no último ano da base de dados, temos informações referentes à 8 meses apenas, diferentemente dos demais anos que possuem dados dos 12 meses do ano.
Conclusões adicionais:
Inicialmente foram verificadas algumas entradas do DataFrame, assim como a dimensão e também as colunas, para se ter uma familiarização da estrutura dos dados.
Em seguida, foi realizada uma análise descritiva e explorátoria completa do dataset para extração de insights sobre a violência no estado do Rio de Janeiro, obtendo os seguintes resultados:
- Verificou-se que todas as variáveis são do tipo numérica e dentre as 56 dispostas, 30 delas possuem altas pocentagens de valores ausentes, tendo maior destaque aquelas referentes a roubo de bicicletas e crimes relacionado a drogas.
- Como tratamento dos valores faltantes para algumas features de interesse, utilizamos apenas o período com valores preenchidos, descartando as informações ausentes.
- Através dos histogramas para verificar a distribuição das variáveis e o resumo estatístico, identificamos a presença de outliers na grande maioria delas e os intervalos com maiores frequências de valores.
- Com relação a crimes envolvendo veículos, temos uma média de 2449 roubos por mês, 1675 furtos e 1772 recuperações, ou seja, somando as percas para o crime, o índice de recuperação de veículos é muito baixo, cerca de 43% apenas.
- Relatando sobre homicídio doloso, o menor índice foi 272 e ocorreu no mês 6 de 2015, já o maior foi de 831 no mês 1 de 1995. Contudo, temos que o intervalo com a quantidade mais frequênte desse crime, ocorre entre 500 e 550 homicídios dolosos registrados mensalmente.
- Obtivemos que a quantidade de morte dos policiais militares (417) são maiores do que as mortes de policiais civis (68), visto que a primeira classe de segurança tem como princípio fazer o policiamento ostensivo e preservar a ordem pública, enquanto a segunda classe, tem como função investigar todos os crimes que aconteçam no estado.
Para saber mais infomações sobre Data Science e divulgação de projetos, me acompanhem no linkedIn e sigam meu blog no medium.
Sobre o autor:
Graduando em estatística pela Ufscar e estudante de Data Science em paralelo, busco alta especialização na área de Machine Learning e negócios.