Introdução a bibliteca Plotly

Introdução a bibliteca Plotly

Olá pessoal, tudo bem com vocês? No artigo de hoje apresentarei a biblioteca Plotly, especificamente Plotly Express, que é uma integração da biblioteca Plotly. Vou mostrar como vocês podem criar gráficos mais bonitos e interativos. Vamos trabalhar com a base de vendas abaixo:

Não foi fornecido texto alternativo para esta imagem

A base de dados possui as seguintes colunas: DataVenda, Data Envio, ID Produto, ID Subcategoria, Subcategoria, Produto, Marca, ID Cliente, País, Estado, Cidade, Custo Unitário, Preço Unitário, Quantidade, Valor Desconto e Valor Venda.

Vamos Começar?

O primeiro passo é importar as bibliotecas que iremos utilizar, você pode fazer isto utilizando o comando abaixo:

Não foi fornecido texto alternativo para esta imagem

Como estamos trabalhando com o Plotly Express o apelido que damos a biblioteca por convenção é px, então sempre que a gente for utilizar o plotly express utilizaremos px em nossos códigos.

Primeiro, vamos verificar o total de vendas que foram realizadas por marca, utilizaremos o método value_counts():

Não foi fornecido texto alternativo para esta imagem

o método value_counts() verifica quantas vezes cada marca aparece em nosso conjunto de dados, para colocar essa informação em um gráfico vamos criar uma nova variável para armazenar o nosso total de vendas por marca e logo em seguida criar o gráfico com o plotly express:

Não foi fornecido texto alternativo para esta imagem

Criamos um gráfico de barras utilizando o método bar() e passamos a variável total_marca que contém exatamente a marca e o total vendido como vimos anteriormente, no eixo x passamos o total_marca.index que retorna os nomes das marcas e para o eixo y passamos o total_marca.values que retorna os valores, em seguida passamos o fig.show() para que o gráfico seja exibido.

Adicionando um título ao nosso gráfico

Para adicionar um título ao nosso gráfico basta passar o parâmetro title e em seguida o título que você deseja:

Não foi fornecido texto alternativo para esta imagem

Adicionando o rótulo de dados

Podemos também adicionar o rótulo de dados, basta passar o parâmetro text e informar quais são os rótulos, neste caso são os valores que se encontram em total_marca.values:

Não foi fornecido texto alternativo para esta imagem

Agora que já estamos familiarizados com a biblioteca, vamos verificar agora a Receita por marca, será que as marcas que mais vendem são as que estão gerando as maiores receitas?

Não foi fornecido texto alternativo para esta imagem

Criamos uma nova variável com o agrupamento da marca e a soma da coluna valor venda, que é justamente a coluna com o valor final da venda, logo em seguida criamos nosso gráfico de barras, observe que a marca com a maior receita não é a marca que mais vende, o quer dizer que tem marca que vende muito mas em contrapartida são vendas de valores pequenos.

Receita por Ano

Vamos analisar agora qual foi a receita por ano, vamos criar um gráfico de pizza para retornar esta informação:

Não foi fornecido texto alternativo para esta imagem

Para criar o gráfico de Pizza utilizamos o método pie() e passamos o nosso df, qual a coluna de valores para o parâmetro values e qual a coluna que queremos analisar para o parâmetro names, que neste caso extraímos apenas o ano da coluna Data Venda. Lembra que falei no ínicio deste artigo que os gráficos criados no Plotly são interativos? caso você queira analisar apenas os anos de 2017 e 2018 você pode desativar o ano de 2019 apenas clicando em cima dele lá na legenda:

Não foi fornecido texto alternativo para esta imagem

Agora, vamos analisar apenas as vendas do ano de 2018 e criar um gráfico de linhas com a receita por mês:

Não foi fornecido texto alternativo para esta imagem


Ao filtrar apenas os dados de 2018, criamos uma variável chamada vendas2018_mes com o agrupamento das vendas por mês e a soma da coluna Valor Venda, depois, criamos nosso gráfico utilizando o método line() do plotly express, onde passamos o eixo x, o eixo y e o título do nosso gráfico. Você também pode fazer seleções no gráfico e analisar apenas um período, como por exemplo a receita apenas do segundo semestre, para isto, basta selecionar no gráfico do mês 6 ao mês 12:

Não foi fornecido texto alternativo para esta imagem

Para voltar a visão padrão você pode ir em Reset axes no menu superior:

Não foi fornecido texto alternativo para esta imagem

E, se a gente quiser acrescentar a informação de Continente em nosso gráfico de linhas? Ou seja, a Receita por mês e por continente. Podemos utilizar o parâmetro color e acrescentar a coluna de continente:

Não foi fornecido texto alternativo para esta imagem


Para finalizar nossa análise, vamos criar uma nova coluna em nosso conjunto de dados chamada Tempo_envio, que será o total de dias que um produto levou para ser enviado, ou seja, Data Venda - Data Envio:

Não foi fornecido texto alternativo para esta imagem

Agora vamos criar um gráfico de Boxplot para analisar a coluna de Tempo_envio:

Não foi fornecido texto alternativo para esta imagem

Você conhece o gráfico de Boxplot? o gráfico de Boxplot ou gráfico de caixa, nos permite visualizar a distribuição dos nossos dados e verificar a presença de Outliers, que são valores discrepantes em nosso dataset. O Boxplot é formado por quartis, os quartis são usados para definir o tamanho da caixa, os valores acima e abaixo dos quartis são usados para cosntruir as hastes, valores fora da caixa e das hastes são considerados Outliers. Po exemplo o gráfico nos mostra que o valor do primeiro quartil é 5, o que quer dizer que até 25% do tempo de envio é 5. Segue abaixo a imagem retirada deste Site para que você entenda melhor o Boxplot:

Não foi fornecido texto alternativo para esta imagem

O gráfico de Boxplot foi criado utilizando o método box() e passamos o df e a variável Tempo_envio para o eixo x.

Por fim, mostrarei como podemos alterar as cores e o background dos nossos gráficos, o Plotly disponibiliza várias paletas de cores que podemos utilizar, para visualizar você pode utilizar o comando abaixo:

Não foi fornecido texto alternativo para esta imagem

Para utilizar qualquer uma das paletas em seu gráfico basta passar o parâmetro color_discrete_sequence e em seguida px.colors.qualitative e o nome da paleta:

Não foi fornecido texto alternativo para esta imagem

E, para alterar o Background dos gráficos, o Plotly também disponibiliza vários templates que você pode encontrar Neste Link, basta adicionar o parâmetro template com o nome do template desejado e você consegue mudar o background dos seus gráficos:

Não foi fornecido texto alternativo para esta imagem

Chegamos ao fim de mais um artigo, espero que você tenha gostado, e caso você queira aprender mais sobre a biblioteca Plotly e todos os seus recursos, você pode dar uma olhada na Documentação que é bastante rica. Até a próxima!!



Entre para ver ou adicionar um comentário

Outros artigos de Fernanda Santos

  • Personalizando seu Dataframe do Pandas

    Personalizando seu Dataframe do Pandas

    Olá pessoal, no artigo de hoje vou mostrar como é possível alterar o estilo do seu dataframe do Pandas, vamos lá? O…

  • Coletando dados do Twitter com Python

    Coletando dados do Twitter com Python

    Olá pessoal, tudo bem? Neste artigo mostrarei o passo a passo para a coleta de dados do Twitter, o Twitter é…

    5 comentários
  • Heatwave

    Heatwave

    Este artigo o guiará pelos estágios em que você estará rodando um MySQL Database System com HeatWave Cluster no Oracle…

    4 comentários
  • Trabalhando com datas no Pandas

    Trabalhando com datas no Pandas

    Olá pessoal, passando aqui para escrever mais um artigo sobre Python e Pandas, neste artigo mostrarei alguns métodos…

    22 comentários
  • Manipulando Strings com Python

    Manipulando Strings com Python

    Olá Pessoal, tudo bem com vocês? Espero que sim, estou aqui mais uma vez para bater um papo com vocês com relação a…

    18 comentários
  • Dividindo Colunas por Delimitador com Python

    Dividindo Colunas por Delimitador com Python

    Olá pessoal, passando para deixar uma dica rápida, um colega do Linkedin em meu útlimo artigo pediu que eu mostrasse…

    20 comentários
  • Análise de dados com Python e Pandas[parte 3] - Criando visualização de dados

    Análise de dados com Python e Pandas[parte 3] - Criando visualização de dados

    Olá pessoal, Tudo bom? Voltei para darmos continuidade ao nosso bate-papo sobre análise de dados com Python e Pandas…

    8 comentários
  • Análise de dados com Python e Pandas[parte 2]

    Análise de dados com Python e Pandas[parte 2]

    Olá pessoal, tudo bom? voltei para continuar nosso bate-papo sobre análise de dados com Python e Pandas, e se você…

    24 comentários
  • Análise de dados com Python e pandas[Parte 1]

    Análise de dados com Python e pandas[Parte 1]

    Olá pessoal, resolvi escrever meu primeiro artigo, aqui no Linkedin, e decidi que seria sobre uma linguagem de…

    53 comentários

Outras pessoas também visualizaram

Conferir tópicos