Análise de Dados do Airbnb em Londres
Considerado a maior empresa do ramo hoteleiro da atualidade - mesmo sem possuir nenhum hotel -, o Airbnb fornece uma plataforma inovadora, que tornou a forma de se hospedar algo alternativo, flexível, e bem mais em conta, conectando hóspedes e anfitriões de maneira prática.
Completando uma década de fundação em 2018, a Startup já hospedara mais de 300 milhões de pessoas ao redor do mundo, desafiando as redes tradicionais de hotéis.
O Airbnb possui uma plataforma para disponibilização dos dados do site para algumas das maiores cidades do mundo, o Inside Airbnb, onde é possível baixar dados para desenvolver projetos e soluções de Data Science, utilizado para desenvolver esse artigo.
Tomando-se os dados da cidade de Londres, é possível observar algumas situações, como os valores ausentes, e valores muito discrepantes da normalidade - chamados outliers -, que dariam margem para uma interpretação equivocada dos dados e diminuiriam a qualidade da análise.
Pode-se verificar os valores ausentes, em taxa percentual, na imagem abaixo, onde a coluna neighbourhood_goup não tem nenhum valor inserido, e as colunas reviews_per_month e last_review possuem aproximadamente 25% de valores ausentes.
Plotados os histogramas para verificar a distribuição dos dados (imagem abaixo), é possível notar que as variáveis minimum_nights e price possuem valores muito além dos usuais - que distorceriam a interpretação da realidade.
E abaixo, já com os outliers retirados, têm-se os histogramas refeitos.
Em média. o mínimo de noites que os anfitriões costumam estabelecer para alugar um lugar são 2 noites, e o preço médio da diária dos aluguéis é € 90.
Analisando os dados referentes aos bairros e valores dos aluguéis, é possível identificar que as hospedagens com valores mais altos estão localizadas no centro - City of London, Kensington and Chelsea, Westminster, por ex. Com os dados referentes à longitude e latitude, é possível plotar o gráfico e verificar essa distribuição.
Essa análise foi realizada utilizando a versão onde os dados estão resumidos - na mesma plataforma está disponível também a versão mais completa. Para melhor entendimento e visualização do projeto, acesse: https://bit.ly/2BEUz68
fonte da imagem do título: https://bit.ly/3i4PAwm