Abstrações do modelo de dados

Abstrações do modelo de dados

A modelagem de dados é um dos primeiros passos no processo de desenho de bancos de dados. É o processo de entender a estrutura do negócio e planejar a maneira como as informações serão organizadas no sistema.

A modelagem se desenvolve em etapas progressivas que evoluem através de diferentes níveis de abstração de modelos (conceitual, lógico e físico), processo em que a equipe é forçada a tomar decisões sobre quais dados são necessários, como serão coletados e estruturados no banco, em diferentes estágios de refinamento de conceitos e requisitos, e em níveis progressivos de complexidade. 

No alt text provided for this image

Nos modelos, os dados são representados por uma coleção de conceitos e notações descrevendo os dados, relacionamentos, semântica e regras de negócio. Um modelo bem construído em cada uma das etapas resulta em dados de maior qualidade, implementações coerentes, maior escalabilidade e manutenção mais fácil do banco de dados.

A fase de design inicia-se com uma abordagem de alto nível de abstração (modelo conceitual, define o "que" do negócio) identificando os dados que estarão contidos na base (entidades), os seus relacionamentos e algumas regras de negócio (constraints), mas ainda não incluem detalhes de implementação.

O desenho começa em um nível alto de abstração, identificando conceitos, as regras de negócio e os elementos necessários, e o resultado é uma representação inicial da estrutura da base de dados, de fácil compreensão, usada como referência para se assegurar que todos os requisitos de negócio estão contemplados.

O desenho prossegue em ciclos de detalhamentos incrementais, nas próximas etapas, incorporando as características de uma "classe" de armazenamento escolhida (relacional ou NoSQL, por exemplo), incrementando o modelo com detalhes (modelo lógico, define detalhes do "como" de negócio). E, detalhando ainda mais, incorporando a estrutura interna de armazenamento do SGBD escolhido (modelo físico, define o "como" da implementação).

No modelo lógico, é preciso associar as características do modelo conceitual àquelas necessárias ao modelo de implementação escolhido, mapeando entidades de negócio a tabelas no modelo relacional, e mapeando os relacionamentos e chaves estrangeiras para manter a integridade referencial dos dados.

Nessa fase são incorporados mais detalhes ao modelo conceitual, mas ainda sem detalhes de implementação física, uma vez que um modelo lógico pode ser utilizado para desenvolver diferentes modelos físicos conforme diferentes bancos de dados escolhidos.

No modelo físico as características de nível mais baixo de abstração são introduzidas, representando a estrutura real da base de dados, incorporando detalhes referentes a padrões de SGBD, performance, armazenamento, particionamento, organização das bases, índices, estruturas de acesso, encriptação etc. Uma vez selecionado o SGBD, o banco pode ser implementado, definindo-se a estrutura de tabelas e colunas, constraints, chaves (PK), relacionamentos (FK), tipos de dados etc.

É o modelo mais próximo do desenvolvimento de sistemas em si, fornecendo o máximo de detalhes possíveis sobre os elementos de dados que estarão em fluxo dentro do sistema, e como estão efetivamente armazenados.

Enquanto o modelo lógico provê informações detalhadas de importância para o negócio, o modelo físico descreve os dados de relevância para o sistema ou serviço, otimizando a implementação dos requisitos de negócio à luz das restrições da tecnologia, uso e desempenho dos aplicativos.

A modelagem deve seguir as boas práticas em todas as fases: convenções de nomeação, padrões de normalização, de chaves primárias, desenho dos índices, e a preocupação com a integridade referencial. Mas na modelagem física considerações extras são importantes: o balanceamento da performance e eficiência, contra o overhead para transações e para manutenção do banco de dados, por exemplo.

Em resumo, o modelo conceitual foca nos requisitos de negócio e retrata as entidades mais importantes e seus relacionamentos básicos; o modelo lógico detalha as características dessas entidades, introduzindo os atributos e mais entidades conforme a necessidade, indicando chaves candidatas, ainda sem atenção aos aspectos técnicos; o modelo físico introduz o contexto do SGBD específico, transformando o modelo lógico em estruturas de implementação física do banco de dados.

Embora possa parecer custoso, cada etapa constrói o entendimento sobre a anterior e são todas necessárias no processo de construção de um banco de dados adequado à aplicação de negócio.

Conceitos de negócio que parecem simples de entender às vezes podem exigir uma implementação técnica complexa, e o mapeamento do modelo em suas diferentes etapas pode conduzir esse processo com segurança.

A modelagem dos dados por etapas iterativas adiciona valor tanto pelo produto final (um modelo bem elaborado) quanto pelo processo de discussão que suscita na elucidação dos requisitos. 

Wellington Luiz Barbosa

Analista em Tecnologia da Informação na Secretaria de Governo Digital do Ministério da Gestão e da Inovação em Serviços Públicos

1 a

Excelente artigo. Sobre o planejamento e desenvolvimento de uma Política de Governança de Dados para o Governo Federal, à sra. dispõe de alguma indicação? Obrigado.

Entre para ver ou adicionar um comentário

Outros artigos de Maria Regina Carvalho

  • Feliz Natal!

    Feliz Natal!

    Natal é época de agradecer e desejar muitas alegrias e felicidades na vida de todos nós. Gostaria de dedicar um momento…

    2 comentários
  • Linhagem de Dados

    Linhagem de Dados

    Linhagem de dados é a habilidade de visualizar e compreender como o dado se movimenta de um ponto a outro dentro da…

    1 comentário
  • Governança de Dados: controle ou flexibilidade?

    Governança de Dados: controle ou flexibilidade?

    Manter estruturas de Governança de Dados na empresa incrementa a confiabilidade nas informações e a integridade da…

    10 comentários
  • Ecossistema de Dados

    Ecossistema de Dados

    O conceito de ecossistema é originário da Biologia, se referindo a uma unidade natural que congrega todas as plantas…

    1 comentário
  • Gravidade de Dados

    Gravidade de Dados

    O termo gravidade de dados foi cunhado na década passada por Dave McCrory e tem recebido mais e mais atenção à medida…

    3 comentários
  • Glossário, Dicionário ou Catálogo de Dados?

    Glossário, Dicionário ou Catálogo de Dados?

    Criar uma cultura de dados tem se tornado essencial para as organizações. São vários os conceitos envolvidos nos…

    8 comentários
  • Federação de Dados

    Federação de Dados

    Um dos grandes desafios para as empresas atualmente é que elas têm que lidar com uma crescente quantidade de…

    3 comentários
  • Resolução de Entidades

    Resolução de Entidades

    O processo de análise de dados, em geral, envolve lidar com dados estruturados e não-estruturados, com grandes…

    5 comentários
  • Feliz Natal!

    Feliz Natal!

    Deus enviou seu anjo Gabriel a uma jovem de Nazaré, cujo nome era Maria. O anjo lhe disse, "Bendita és tu entre todas…

    1 comentário
  • Dados Mestres e Dados de Referência

    Dados Mestres e Dados de Referência

    Os processos de operações de negócio requerem dados a respeito dos objetos envolvidos em transações (exemplo: cliente…

    5 comentários

Outras pessoas também visualizaram

Conferir tópicos