Desbravando os conceitos ETL, ELT e ETL Reverse com Azure: Uma Jornada Prática
🤗Olá ! Meu nome é Natalya Correia, tenho 24 anos, sou formada em Análise e desenvolvimento de Sistemas pela faculdade Impacta, graduanda do MBA Data Science pela USP e Microsoft Data Associate.
Com as minhas experiências em consultorias e encabeçando diferentes projetos de produtos de dados com distintas perspectivas de negócios, decidi dividir um pouco sobre os conceitos de Modelagem de dados, Engenharia de dados, Tratamento de dados e Visualizações de dados aqui na minha #Rede, com uma linguagem simplificada, exemplificação rápidas e estou ansiosa para fazer a troca de experiências e dividir conhecimento com vocês!
Então vamos lá ...
🌍Em um mundo cada vez mais digital, a coleta, armazenamento e análise de dados tornaram-se pedras angulares para o sucesso de qualquer organização.
💻Nesse contexto, técnicas como ETL (Extração, Transformação e Carregamento), ELT (Extração, Carregamento e Transformação) e ETL Reverse desempenham papéis cruciais.
📃Neste artigo, exploraremos esses conceitos em detalhes e mostraremos como eles se encaixam perfeitamente nas ferramentas robustas da Microsoft Azure.
1️⃣O que é ETL?
O ETL, que significa Extração, Transformação e Carregamento, é um processo fundamental para a transformação de dados. Vamos mergulhar mais fundo em como isso funciona com as ferramentas Azure:
Imagine que você trabalha em uma empresa de varejo e deseja analisar dados de vendas de lojas físicas e online. O Azure Data Factory entra em cena, permitindo a extração de dados dessas fontes heterogêneas. Os dados brutos são coletados e, em seguida, aplicamos transformações específicas para padronizar os formatos, calcular métricas e criar um painel de vendas abrangente. Finalmente, esses dados transformados são carregados em um data warehouse no Azure SQL Data Warehouse, onde podem ser acessados para análises detalhadas.
Partindo da exemplificação acima, o ETL segue exatamente sua regra que lhe nomeia. Extração dos dados direto da sua fonte, transformação (implementação de todos os tratamentos necessários nas bases + rotinas de negócio e criação de métricas definidas em levantamento de requisitos) e carregamento para um repositório que pode ser facilmente consumido e utilizado para consultas.
2️⃣O que é ELT?
O ELT, ou Extração, Carregamento e Transformação, inverte a ordem do ETL, onde os dados são primeiro carregados em um repositório, como um data lake ou data warehouse, e, em seguida, as transformações são aplicadas. Vamos explorar como isso é feito com exemplo de ferramentas Azure:
Suponha que você gerencia uma empresa de análise de mídia social. Você lida com enormes volumes de dados brutos das redes sociais. O Azure Data Lake Storage é seu local de escolha para armazenar esses dados em sua forma bruta. O Azure Databricks, por outro lado, entra em cena quando é hora de aplicar transformações sob demanda. Aqui, os dados brutos podem ser analisados diretamente, permitindo análises flexíveis e rápidas.
Recomendados pelo LinkedIn
Nesse exemplo acima, o Azure DataBricks pode estar orquestrando workflows de extração de dados, com armazenamento no storaged e ao mesmo tempo permitindo-se o na etapa de transformações para criação de camadas de análise de dados, para consumo das áreas de negócio.
3️⃣O que é ETL Reverse?
Agora, vamos explorar o ETL Reverse em mais detalhes e como ele pode ser aplicado a um novo sistema transacional:
Sua empresa está implantando um novo sistema transacional para gerenciar pedidos online. Para garantir que tudo funcione sem problemas, você precisa testar a nova plataforma com dados do sistema antigo. Aqui está como você pode aplicar o ETL Reverse com a ajuda das ferramentas Azure:
1. Extração dos Dados Originais: Comece extraindo os dados originais do sistema antigo, o Azure Data Factory pode ser usado para essa extração.
2. Carregamento no Novo Sistema: Em seguida, carregue esses dados no novo sistema transacional. Certifique-se de que os dados estejam estruturados corretamente e que os relacionamentos sejam mantidos.
3. Reversão das Transformações: Utilize o Azure Data Lake Analytics para reverter as transformações aplicadas aos dados originais. Isso restaurará os detalhes originais dos pedidos, como foram registrados no sistema antigo.
4. Testes e Validações :Agora você tem um ambiente de testes realista com dados reais. Isso permite testar a nova plataforma com cenários do mundo real antes de sua implantação completa.
📝Portanto chegamos a um denominador comum....
Dominar os conceitos de ETL, ELT e ETL Reverse é essencial em uma era orientada por dados. Com as ferramentas do Microsoft Azure, você pode aplicar essas técnicas de maneira eficaz e prática, não apenas para análise de dados, mas também para facilitar transições suaves entre sistemas.
À medida que continuamos nossa jornada na revolução dos dados, compreender esses conceitos e dominar as ferramentas Azure nos coloca na vanguarda da análise de dados e da tomada de decisões informadas.
Então, que comece a jornada de transformar dados em insights com o Azure! 🚀
Se você trabalha,estuda ou trabalha com outras ferramentas, deixa aqui suas experiências !
Dados & Analytics | Governança de Dados | Gestão de Performance e Analise de Resultados | Processos & Melhoria Continua | FP & A | Análise de Projetos de Investimento | Gestão de Custos
1 aParabéns Natálya!! Muito bom!!!
Engenheiro de Produção | Green Belt em Lean Seis Sigma | Processos | Melhoria Contínua
1 aParabéns Natalya, muito top.
Web designer | HCL Digital Experience (Websphere Portal - WCM) | Motion Designer | Designer Gráfico | UX/UI | Full Stack Designer
1 aExcelente artigo Natálya Lopes Correia
Revenue Management | Pricing | Data & Business Analytics | Product Management | Transformation | IESE 26' EMBA Candidate
1 aNat, que bom ler o seu artigo e ele estar falando exatamente de um pedacinho da nossa jornada juntas aqui na Copa. Aguardo ansiosa por mais posts, pois eles ajudarão cada vez mais levar a cultura data-driven!!