Glossário, Dicionário ou Catálogo de Dados?

Glossário, Dicionário ou Catálogo de Dados?

Criar uma cultura de dados tem se tornado essencial para as organizações. São vários os conceitos envolvidos nos processos de Governança de Dados, que podem ser bastante subjetivos a depender da cultura da organização. Mas é importante ter uma definição básica desses conceitos, entendendo as semelhanças e distinções, para que todos possam se orientar no contexto da disciplina de Governança, sem suposições ou deduções imprecisas.

O objetivo aqui é identificar os conceitos de Glossário de Negócios, Catálogo de Dados e Dicionário de Dados, às vezes utilizados de forma intercambiável, mas que têm significados diferentes. Embora sejam entidades separadas e distintas, relacionam-se entre si para descrever diferentes aspectos e níveis de abstração do ambiente de dados da empresa.

É importante ter em mente que algumas dessas soluções de governança podem ter sido desenvolvidas no escopo de projetos ou unidades de negócio, padronizando informações em "silos" nas empresas e criando espaço para inconsistências. Mas o verdadeiro valor agregado é quando as ferramentas abrangem a visão corporativa e multissistêmica.

O Glossário de Negócios (às vezes referenciado como Glossário de Dados) consiste de uma lista de termos de negócio e suas definições, que definem conceitos principais de negócio para uma organização, retirando ambiguidades, independentemente de como possam constar em uma base de dados.

Tem foco maior em unificar conceitos de negócios (que podem significar coisas diferentes para diferentes públicos), melhorando a colaboração entre as equipes; tem como público prioritário os usuários de negócio; e tem como objetivo a definição de vocabulário comum de forma que termos e conceitos básicos negociais sejam utilizados nos contextos adequados

Um Dicionário de Dados é uma descrição detalhada dos ativos de dados da empresa, inventariando as propriedades do conjunto de tabelas e colunas de um banco de dados, incluindo informações sobre sua estrutura, relacionamentos e usos - como atributos, tipo de dados, tamanhos, domínios, defaults, constraints e relações entre os objetos.

Tem foco maior em ativos físicos de dados; tem como público prioritário os analistas de TI; e tem como objetivo entender os ativos de dados e bancos de dados e suportar a manutenção e distribuição desses dados.

O Dicionário de Dados tem algumas restrições. Primeiro, ele descreve as informações sobre um conjunto de dados, mas se essa informação estiver guardada em múltiplas tabelas, o dicionário não diz quais as tabelas provêm informações semelhantes. Segundo, a informação que se procura pode não existir fisicamente guardada em banco de dados, podem ser derivadas e calculadas por processo, o que também não é revelado pelo dicionário.

O Glossário de negócios, no entanto, é orientado por conceitos de negócio e voltados para usuários finais - dispõe de algumas facilidades de pesquisa para encontrar as informações funcionais e seus significados.

Termos de negócio podem ser relacionados a tabelas e colunas no banco de dados para prover contexto e significado para diferentes instâncias de dados dentro de diferentes bancos de dados, ajudando a identificar dados similares em bancos separados, fazendo a ponte entre negócio e TI.

O Catálogo de Dados é uma plataforma centralizada que utiliza metadados para associar as informações dos ativos de dados da organização e criar um inventário que permite que elementos de dados sejam classificados logicamente em um determinado contexto de negócio, o que ajuda os profissionais de dados a navegar, encontrar e compreender as informações necessárias aos diferentes propósitos em que estejam trabalhando.

O Catálogo de Dados normalmente é implementado com base no Glossário de Negócios e no Dicionário de Dados, associando conceitos lógicos da camada semântica e correlacionando com objetos físicos dos bancos de dados. Os metadados podem ser evoluídos para incrementar o contexto e ajudar a descoberta de dados com maior facilidade e governança, suportando a pesquisa por palavras-chave, a avaliação da pertinência do dado ao contexto de análise, o controle de acesso e segurança dos dados.

Por ter uma abrangência maior dentro da organização, o Glossário de Negócios é mais facilmente compreendido e implementado com custos bem menores, sem necessidade de infraestrutura complexa.

O Dicionário de dados é direcionado a uma audiência mais técnica e especializada, apresentada em formato de diagramas e tabelas, e é mais difícil de ser compreendida do que o glossário (que descreve os conceitos em formato de texto). Sua implementação é mais complexa e exige automação dos recursos.

O Catálogo de Dados busca unificar essas duas ferramentas, simplificando o acesso a recursos técnicos e permitindo pesquisa estruturada sobre todos os dados da organização. Permite responder questões como: quais os dados que tenho? Onde estão localizados? Quais são os atributos e detalhes desses dados? Qual sua origem? Como são utilizados? Que decisões esses dados apoiam? Essas decisões são bem-sucedidas? Faltam dados ou estão incorretos?

O conjunto dessas ferramentas providencia a "visão única da verdade" sobre os recursos de dados, permitindo que diferentes públicos possam tirar melhor proveito dos recursos, provendo contexto para colaboração, com organização, gerenciamento e pesquisa que otimiza o valor dos dados e informações, direcionando decisões estratégicas e eficiência operacional.

Organizações são dinâmicas e estão em constante mudança. A camada semântica precisa ser holística e flexível para permitir o crescimento e as mudanças necessárias no contexto empresarial.

É importante que esses instrumentos de governança de dados estejam integrados, fazendo a ponte entre negócio e TI, para a colaboração e comunicação consistente entre todos os atores e para o sucesso de um bom programa de Governança de Dados. A visão dos metadados e da linhagem dos objetos de dados nos bancos, integradas com os conceitos de negócio corporativos, provê transparência e ajuda a construir valor para a organização.

ORÉLIO Antônio Saraiva

Arquitetura da Informação Organizacional (Pesquisador, Assessor e Consultor); UEB-União dos Escoteiros do Brasil (Voluntário); APR-Assoc.Promessa de Rute (P/ jovens acima 18 anos termina o Sistema Apoio do Governo).

1 a

Na forma apresentada fica compreensível para as organizações complexas a importância de valorizar os níveis semântico, conceitos adotados na organização e dados disponíveis sobre tais entes. É também, quanto melhor vivenciado na empresa, um excelente instrumento nos momentos de mudança (Absorção de negócios, novos negócios, desmembramentos por vendas ...) pois permite dimensionar os impactos e co-dependências de impactos decorrentes de mudanças na semântica e nos conceitos. Grato! Parabéns!

Cesar Augusto Lima

Data Management • Data Governance • Process Improvement • Quality Systems

1 a

Muito interessante a abordagem. Em nossa empresa temos um dicionário de dados mestres, em Excel. É um intercâmbio entre os modelos descritos. Uma pena não termos ainda uma ferramenta própria para isso. Esse dicionário já noa ajudou em muitos projetos, servindo para orientar usuários e também IT em projetos.

Excelente!!

Entre para ver ou adicionar um comentário

Outras pessoas também visualizaram

Conferir tópicos