Restricción de Integridad y tipos de DB Keys | The Data Warehouse series #6

Alejandro Loredo

Project Management || Data Analysis || Data Engineering

Fecha de publicación: 30 mar 2024

La década de 1970 vio nacer los sistemas computacionales de bases de datos relacionales en entornos informáticos que sentaron las bases teóricas y prácticas de lo que conocemos hoy como sistemas de gestión de bases de datos relacionales o RDBMS por sus siglas en inglés.

Uno de los hitos más significativos en el campo de lo datos en esta década fue la publicación del modelo relacional por parte del informático Inglés Edgar F. Codd en su influyente artículo "A Relational Model of Data for Large Shared Data Banks" ("Un modelo relacional de datos para grandes bancos de datos compartidos"). Este modelo proponía representar los datos en forma de tablas con filas y columnas, y para relacionar los diferentes conjuntos de datos se implementó el uso de un tipo de elementos que llamados "Keys". Estas keys permiten identificar las filas/tuplas de una tabla y también establecer relaciones entre varias columnas o tablas. Pocos años mas tarde, en 1976, Peter Chen publica su artículo "The Entity-Relationship Model - Toward a Unified View of Data" dando forma a lo que conocemos hoy como las bases del modelo entidad relación o MER.

La Integridad de Clave o Restricciones de Integridad

Edgar F. Codd, si bien no le pone nombre al concepto, describe en su obra un conjunto de reglas o restricciones que aplicadas a las claves primarias y foráneas garantizan la validez y la consistencia en una base de datos relacional:

Unicidad: Cada clave primaria debe ser única en la tabla a la que pertenece.
No nulidad: Las claves primarias no pueden contener valores nulos.
Referencialidad: Las claves foráneas deben hacer referencia a una clave primaria (o una clave única) en otra tabla. Esto garantiza la coherencia y la integridad referencial entre las tablas relacionadas.
Consistencia: Las relaciones entre las claves primarias y foráneas deben mantenerse en todo momento. No se deben permitir operaciones que dejen relaciones huérfanas o incoherentes en la base de datos.

Los tipos de keys

En el modelo de entidad relación, las keys más popularmente conocidas quizás sean:

Primary Keys: Las primary keys eran identificadores únicos asignados a cada registro dentro de una tabla. Estas keys aseguraban la unicidad de los datos en la tabla y servían como punto de referencia para las relaciones con otras tablas.
Secondary Keys: También conocidas como "alternate keys", estas keys proporcionan identificaciones únicas para registros específicos dentro de una tabla. Aunque no son las claves principales, mejoran la eficiencia de las consultas al permitir búsquedas en columnas específicas.
Foreign Keys o cláves foraneas: Las foreign keys establecen relaciones entre las tablas de una base de datos relacional. Estas keys hacen referencia a las primary keys de otras tablas, garantizando la integridad referencial entre los datos y evitando la aparición de registros huérfanos o inconsistentes.

Sin embargo, otros conceptos de claves no tan populares pero igualmente importantes son:

Candidate Keys: Son claves primarias potenciales. De todas las claves candidatas en una tabla, generalmente se selecciona una para ser la clave primaria. También conocidas como "candidate primary keys", son columnas o combinaciones mínimas de columnas que podrían funcionar como primary keys ya que identifican de manera única una tupla (fila) cumpliendo con la propiedad de unicidad.
Unique Key: El concepto es similar al de una primary key, pero puede contener valores NULL y puede haber múltiples claves únicas en una tabla. Mientras que una clave primaria garantiza la unicidad de cada fila en una tabla (no puede haber dos filas con el mismo valor en la columna de la clave primaria), una clave única garantiza la unicidad de los valores en una columna o un conjunto de columnas, pero puede permitir valores nulos. La unique key garantiza que los valores en una columna, o una combinación de columnas, sean únicos para cada fila en la tabla, es decir no pueden tener valores duplicados (excepto posiblemente NULL, dependiendo de la configuración).
Composite Keys: Son claves compuestas por dos o más columnas y que, en conjunto, identifican de manera única cada registro en una tabla. Estas keys son útiles cuando ninguna columna por sí sola puede servir como primary key. Si pensas que las composite keys son muy similares a una candidate keys, no estarias del todo equivocado, pero la gran diferencia es que una candidate key puede ser una sola comuna mientras que para ser una composite key esta debe ser de dos o más columnas.
Super Keys: Es cualquier conjunto de una o más columnas que puede identificar de manera única cada fila en una tabla, aunque no sea el conjunto mínimo, esto incluye tanto claves primarias como claves candidatas. Si bien por definición toda Composite key es una Superkey, el uso de Super Keys puede proporcionar varias ventajas en términos de eficiencia y rendimiento en la administración de bases de datos que abordaremos en otro artículo posterior de esta serie.

La siguiente imagen ilustra muy claramente como una Superkey, CandidateKey y PrimaryKey se relacionan:

Restricción de Integridad y tipos de DB Keys | The Data Warehouse series #6

Alejandro Loredo

Project Management || Data Analysis || Data Engineering

La Integridad de Clave o Restricciones de Integridad

Los tipos de keys

Recomendado por LinkedIn

Más artículos de este autor

Otros usuarios han visto

SADAS: Database Columnar mejora el rendimiento de OLAP

3 Pecados Capitales cometidos en los procesos ETL

Depurando mis Contactos a través de procesos ETL

Base de datos relacional: ¿Para qué tener Foreign Keys?

¿SQL, NoSQL? ¿Cómo decidir qué base de datos utilizar?

Soluciones para el soporte al almacenamiento, búsqueda y análisis de información

El Renacimiento de SQL: Innovaciones que Están Moldeando el Futuro de las Bases de Datos Relacionales

Las herramientas de procesamiento OLAP de consultas para el Big Data

Las Doce Reglas de las Bases de Datos

Comienza el año con Quest! Monitoreo centralizado de consultas SQL

Ver temas

La Integridad de Clave o Restricciones de Integridad

Los tipos de keys

Recomendado por LinkedIn

#2: Programar_es_solo_para_genios = FALSE

16 jun 2024

Programar_es_solo_para_genios = FALSE

10 jun 2024

Surrogate keys | The Data Warehouse series #7

8 abr 2024

The Data Warehouse series #5 | Data Vault 1.0

8 feb 2024

Data Analysis | The Missing Data Assumptions ESP & ENG

2 feb 2024

The Data Warehouse series # 4 | Schemas: Star, Snowflake, Galaxy

11 ene 2024

The Data Warehouse series #3 | Dimensional modeling & the OLAP cube

4 ene 2024

The Data Warehouse series #2 | El ciclo de vida de Kimball

27 dic 2023

The Data Warehouse series #1 | Top-down VS Bottom-up

22 dic 2023

Business Intelligence & Data analytics | My notes 8'23

3 sept 2023

Otros usuarios han visto

SADAS: Database Columnar mejora el rendimiento de OLAP

3 Pecados Capitales cometidos en los procesos ETL

Depurando mis Contactos a través de procesos ETL

Base de datos relacional: ¿Para qué tener Foreign Keys?

¿SQL, NoSQL? ¿Cómo decidir qué base de datos utilizar?

Soluciones para el soporte al almacenamiento, búsqueda y análisis de información

El Renacimiento de SQL: Innovaciones que Están Moldeando el Futuro de las Bases de Datos Relacionales

Las herramientas de procesamiento OLAP de consultas para el Big Data

Las Doce Reglas de las Bases de Datos

Comienza el año con Quest! Monitoreo centralizado de consultas SQL

Ver temas