Data Lakehouse
Na era de grande volume de dados mais conhecido como big data, surgem novos conceitos, tornando os desafios de se trabalhar com grande volume de dados alcançáveis. Um conceito que vem ganhando espaço é o Data Lakehouse, que nasceu no ambiente em nuvem, é uma arquitetura que combina as melhores características de dois conceitos amplamente utilizados em engenharia de dados: o Data Lake e o Data Warehouse. Logo essa abordagem visa superar as limitações e desafios associados a essas duas estruturas tradicionais.
Data Lake, pode-se armazenar dados estruturados e não estruturados, ou seja, pode armazenar dados brutos e de varias fontes, sem a necessidade da trabalhar esses dados para armazenamento. Por esse motivo pode-se enfrentar desafios com relação a governança desses dados, principalmente a qualidade dos dados e o desempenho da análise.
Já no Data Warehouse, armazena-se dados estruturados, além disso esses dados passam por um processo de extração, transformação e carga (ETL) para os dados serem armazenados de forma adequada no Data Warehouse. Porem, à medida que os volumes de dados crescem, pode ser desafiador dimensionar um Data Warehouse para atender as necessidades em constante evolução da organização. Portanto a aplicabilidade de Data lakehouse pode ser importante para empresas cujo os dados estão em ascensão. Porém, é sempre bom frisar que tudo depende da necessidade da empresa e identificar os requisitos do negócio.