Modelo Star Schema e sua importância para o Power BI
Entenda de vez aqui...
O esquema em estrela é uma abordagem de modelagem amplamente adotada por data warehouses relacionais. Neste modelo, temos que os modeladores classifiquem suas tabelas como dimensão ou fato.
Tabelas de Dimensão descrevem as entidades de negócios - os itens que se modela. Tais entidades podem incluir produtos, pessoas, locais e conceitos e também o tempo. Uma tabela de dimensão contém uma coluna (ou colunas!) de chave que atua como um identificador exclusivo.
Já as Tabelas de Fato armazenam observações ou eventos e podem ser ordens de venda, saldos de estoque, taxas de câmbio, temperaturas, dentre outras muitas possíveis variáveis de negócio. Uma tabela fato contém colunas chave de dimensão relacionadas a tabelas de dimensão e colunas de medidas numérica.
As colunas de chave de dimensão determinam a dimensionalidade de uma tabela de fatos, enquanto os valores de chave de dimensão determinam a granularidade de uma tabela de fatos. Em geral, as tabelas de dimensões contêm um número relativamente pequeno de linhas. As tabelas fatos, por outro lado, podem conter um grande número de linhas e continuar a crescer ao longo do tempo.
Normalização versus Desnormalização
Normalização é o termo usado para descrever dados armazenados de uma forma que reduza dados repetidos.
Por exemplo, imagine uma tabela de produtos que tenha uma coluna chave-valor exclusiva, como o código do produto, e outras colunas que descrevam características como nome, categoria, cor e tamanho do produto. Tal tabela é considerada normalizada quando armazena apenas chaves, como a do produto. Se armazenar detalhes além da chave, ela será considerada desnormalizada.
Ao obter dados é provável, na maior parte das vezes, que sejam dados desnormalizados. Nesse caso, é importante o uso do Power Query para transformar e moldar dados de origem em várias tabelas normalizadas.
É essencial o esforço para desenvolver modelos semânticos otimizados do Power BI com tabelas que representem dados de fato e dimensão normalizados. No entanto, há uma exceção em que uma dimensão de floco de neve pode ser desnormalizada para produzir uma única tabela de modelo.
Recomendados pelo LinkedIn
Relevância do Star Schema para modelos semânticos do Power BI
Cada visual de relatório do Power BI gera uma consulta que é enviada ao modelo semântico do Power BI. As consultas filtram, agrupam e resumem os dados do modelo. Assim, um modelo bem projetado fornece tabelas para filtragem, agrupamento e tabelas para resumo.
Tal design se ajusta bem aos princípios do esquema estrela:
O tipo de tabela ser dimensão ou fato é determinado pelas relações do modelo. Uma relação de modelo estabelece um caminho de propagação de filtro entre duas tabelas e é a propriedade de cardinalidade da relação que determina o tipo de tabela.
Uma cardinalidade em uma relação comum é uma relação de um para muitos ou seu inverso, de muitos para um. O lado "um" é sempre uma tabela de dimensões enquanto o lado "muitos" é sempre uma tabela de fatos.
Um design de modelo bem estruturado inclui tabelas de dimensões ou fatos. Nunca é bom misturar os dois tipos de dado em uma única tabela.
Também é importante fornecer o número certo de tabelas com os relacionamentos certos. E que as tabelas de fatos sempre carreguem dados em uma granularidade consistente.
Por fim, é importante entender que o design ideal de modelos é parte ciência e parte arte e cabe a você saber quando convém cada um.
#starschema #esquemaestrela #powerbi #datawarehouse #modeladedados #análisededados
Especialista em Gestão Comercial e Relacionamento com Clientes | Liderança de Equipes | Estratégias de Vendas B2B/B2C | Experiência em CRM e Sucesso do Cliente
1 mMuito informativo