BASES DE DATOS RELACIONALES ~ Jhorge Ibarguen Medellin

JHORGE ONETH IBARGUEN MORENO

Fundamentos de Bases de Datos

Unidad Didáctica 2: Bases de Datos Relacionales

2.1 ¿Qué es una Base de Datos Relacional?

Introducción

Un sistema de Administración de Bases de Datos permite que los datos permanezcan independientes de los programas de aplicación que los manipulan. Esta es una característica muy importante, por todos los beneficios que le ofrece a quien desarrolla programas para accederlos. Esta característica recibe diferentes nombres, tales como independencia de datos, o independencia lógica. Esta independencia se logra a través de un proceso de abstracción de datos, que permite definir a los mismos de manera abstracta, independiente de la tecnología en la cual la base de datos llegara a implantarse.

Para lograr lo anterior, un concepto fundamental de la abstracción de datos en bases de datos es el concepto de un modelo de datos, el cual permite definir los requerimientos de datos de un área de la empresa, mucho antes de pensar en cómo representarlos en tecnología.

El modelo de datos entonces define a los datos de tal forma que se organizan para ser manipulados en la base de datos. Este módulo permite introducir el concepto de Bases de Datos Relacionales, y la forma en la cual los datos se pueden definir para ser representados en base a relaciones matemáticas, o relaciones, esencia del modelo relacional. La forma natural de representar una relación es en base a una tabla, o representación tabular de las relaciones.

¿Qué es una Base de Datos Relacional?

El modelo relacional es el modelo de datos que soporta a la mayoría de los productos de bases de datos en el mercado actual. Es un modelo formal, basado en las matemáticas, en su concepto de relación matemática y en la teoría de conjuntos. El contenido de este módulo y el siguiente presentan los conceptos y términos que se presentan a continuación:

· Relaciones matemáticas o tablas relacionales

· Llaves, primaria, alterna, foránea

· Diseño de bases de datos relacionales

· Normalización

¿Qué es un Modelo de Datos?

Un concepto muy importante y fundamental para hablar de abstracción de datos en el área de bases de datos es el modelo de datos. Un modelo de datos permite representar los requerimientos de datos de un área bajo análisis en una forma organizada, para facilitar su representación en un producto de bases de datos, y posteriormente su manipulación.

Un modelo de datos se forma de:

· Elementos de modelación, que permiten definir la estructura de los datos, tales como tipos de datos, dominios, y reglas de integridad. (DDL)

· Operaciones para poder actualizar y consultar la base de datos. (DML)

¿Qué es un Lenguaje de Definición de Datos (DDL)?

Son los elementos de modelación que permiten definir el metadata de la base de datos, es decir, los datos acerca de los datos, que se almacenan en el DBMS, en el catálogo del sistema.

¿Qué es un Lenguaje de Manipulación de Datos (DML)?

Son las operaciones que permiten el acceso a la base de datos para actualización y consulta a los datos de la base de datos, y poder resolver cualquier consulta que los usuarios requieran de la misma.

El uso de un Modelo de Datos en la creación de una Base de Datos

Para la creación de una base de datos es necesario contar primero con el modelo de datos que permita crearla. El modelo de datos, como abstracción de la realidad, es la herramienta utilizada para la representación de las entidades y los atributos que las describen, así como las relaciones entre ellas. Este modelo sirve como base para poder crear una base de datos. El enfoque de modelación más usado es el modelo Entidad-Relación.

El modelo entidad-relación (E-R) se basa en percibir y modelar el mundo real en base a elementos básicos de construcción: entidades y relaciones entre ellas, así como atributos que permiten describir a ambos elementos. De todo lo anterior se deduce que el punto clave en la construcción de la base de datos será el modelo de datos.

Con la modelación de los datos requeridos por una base de datos se logra:

1. Formalización: definir formalmente las estructuras permitidas y las restricciones, a fin de representar los datos que requiere una aplicación, y la base de datos requerida.

2. Diseño: el modelo resultante es la materia prima esencial para el diseño de la base de datos.

¿Qué es el Modelo Relacional?

El modelo relacional fue propuesto por E.W. Codd en 1970. Es actualmente el modelo que soporta a la gran mayoría de los sistemas de bases de datos de la actualidad. El modelo provee características únicas de modelación, que permiten crear modelos de datos relacionales, con relativa facilidad.

El Modelo Relacional ofrece las siguientes ventajas:

· Los datos se representan en relaciones, cuya manera natural de representación es en forma de tabla bidimensional. Esta representación es muy simple de entender y visualizar, además de que es conocida y utilizada en muchas formas de trabajo de la vida diaria, tanto en la escuela como en el trabajo.

· Un ejemplo de una tabla relacional se presenta a continuación:

Alumno

Matrícula	Nombre	Apellido	Ciudad	Estado	Carrera	Fecha de Nacimiento
45175	José	Pérez	Monterrey	NL	Ing. En Electrónica	21/01/1980
46550	Luis	Martínez	Hermosillo	SON	Ing. En Computación	12/06/1981
47123	René	González	Toluca	MEX	Lic. En Economía	13/09/1992

· Es un modelo formal de datos, característica que lo diferencia de los otros modelos.

· Es un modelo basado en las matemáticas, en el concepto de relación matemática y en teoría de conjuntos.

· La manera natural de representar una relación es en forma de tabla, que permite una conceptualización y explicación sencilla de este concepto.

· Además, por ser un concepto matemático, las tablas que forman una base de datos relacional son manipuladas con muchas ventajas por operadores matemáticos muy sencillos y poderosos, el álgebra y el cálculo relacional. A partir de estos operadores, es muy sencillo resolver cualquier consulta que un usuario requiera. Estos lenguajes, conjuntos de operadores, están presentes en el SQL, lenguaje estándar para la manipulación de Bases de Datos relacionales comerciales.

2.2 Conceptos Fundamentales de una Base de Datos Relacional

La teoría que soporta a las bases de datos relacionales es muy formal, matemática. Por esta razón, es importante conocerla para tener un entendimiento que permita obtener el máximo aprovechamiento de ésta. Los conceptos que se presentan en este apartado deben permitir que se aproveche al máximo la tecnología, por lo que su entendimiento es indispensable. Se presentan esos conceptos a continuación.

¿Qué es una Relación Matemática/Tabla relacional?

Un elemento fundamental en el modelo relacional es el concepto de relación matemática, o tabla relacional.

Una relación o tabla relacional, en su forma más simple, es un conjunto de renglones (también conocidos como tuplas, registros, ocurrencias, o instancias).

De una manera más formal, es el conjunto de tuplas, o renglones, formados por un conjunto de valores tomados a partir de “n” diferentes dominios. Se puede expresar de la siguiente manera:

Relación R:

· Dado un conjunto de “n” dominios, D1 a Dn, una relación R se define como el conjunto de tuplas ordenadas, denotadas como <d1, d2, …, dn> donde cada tupla es formada tomando un valor de cada uno de los dominios

· Se denota asi: R = {<d11, d21, …, dn1>1, <d12, d22, …, dn2>2, …, <d1m, d2m, …., dnm>m }

Por ejemplo, en la tabla relacional ALUMNO, cada renglón corresponde a los datos de un alumno en particular. La tabla o relación contiene entonces los renglones que representan los datos de los alumnos en una escuela.

Cada uno de los datos almacenados en un renglón representa el valor de un atributo, para cada atributo que forma una tabla relacional. En la tabla de alumno, los atributos que describen a la tabla o relación son: Matrícula, Nombre, Apellido, Ciudad, Carrera y Fecha de Nacimiento.

Finalmente, cada columna de la tabla relacional, cada atributo, contiene los valores del atributo para cada uno de los renglones u ocurrencias de la tabla. Los valores que un atributo puede tomar se conocen como el dominio del atributo, y es muy importante su definición, ya que permite cuidar las reglas de los valores válidos en un atributo.

Cada tabla debe tener entonces la siguiente definición:

· Nombre de la tabla

· Nombre para cada columna o atributo que forma la tabla

· El dominio sobre el cual está definido cada uno de los atributos que forman la tabla.

Características de una tabla relacional

· Una tabla relacional es una tabla bidimensional que posee la siguientes características:

· Los renglones poseen datos acerca de una entidad, entendiendo como entidad a algo acerca de lo cual se desea almacenar datos.

· Las columnas contienen datos acerca de los atributos de la entidad.

· Cada posición en la tabla almacena un valor simple, atómico, de un atributo.

· Todos los valores almacenados en una columna son del mismo tipo, es decir, están definidos sobre el mismo dominio.

· Cada columna o atributo debe poseer un nombre único.

· El orden de las columnas no es relevante.

· El orden de los renglones no es relevante.

· No pueden existir dos renglones idénticos en la tabla.

· Se utiliza el nombre de tabla relacional, en lugar de relación, para evitar confundir con el nombre que se le da a una relación en el sentido natural del Español, es decir, la asociación entre elementos, aunque es importante aclarar que no todas las tablas son relaciones.

· Los siguientes términos se utilizan de manera equivalente, para referirse a términos comunes en el área de Bases de Datos: Tabla/renglón/columna = archivo/registro/campo = relación/tupla/atributo.

· El grado de una relación es el número de columnas o atributos de la misma y no puede ser cero, una tabla no puede existir sin columnas.

· La cardinalidad de una tabla es el número de renglones o tuplas en la tabla.

Que es una Llave

Una llave está formada por uno o más atributos que permiten identificar de forma única a cada tupla o renglón en una tabla relacional. Una llave compuesta es una llave que está formada por dos o más atributos.

Además:

§ Una tabla relacional puede tener sólo una llave primaria, pero pueden tener llaves adicionales, que son llamadas llaves candidatas o alternas

§ Una llave primaria se usa para

– Establecer relaciones entre diferentes tablas

– Permiten organizar la forma en que las tablas se almacenan

– Son usadas para generar índices, mecanismos usados para el acceso eficiente a los datos

Llave primaria

En tablas en las cuales existe más de una llave, se selecciona a una de ellas, como la llave con la cual se realizan búsquedas o con la cual se establecen relaciones entre las tablas. Este es el caso de la llave primaria. Las llaves restantes son llamadas llaves alternas o secundarias.

La selección de la llave primaria se considera normalmente sobre la base de ser la llave más pequeña, aunque no es una condición absoluta. El caso de una llave compuesta, que consiste de varios atributos, es mucho más compleja de manejar como llave primaria, por ejemplo.

¿Qué es un Esquema de Base de Datos Relacional?

Un esquema de base de datos relacional es un conjunto de definiciones de tablas relacionales, y un conjunto de reglas o restricciones de integridad.

La definición de tablas relacionales procede de definir los requerimientos de un área de aplicación. Las reglas de integridad definen todas aquellas condiciones, o restricciones, que los datos deben cumplir, para mantener la integridad de los datos, y su valor.

Las reglas de integridad se agrupan en:

· Estructurales, que son específicas al modelo de datos relacional.

· Semánticas, que son específicas a la aplicación, impuestas por las reglas de negocio que la aplicación misma pide cumplir. Un ejemplo puede ser las condiciones que una empresa puede requerir para la contratación de un empleado, y que el sistema debe cumplir, lo que impone reglas que los datos de la base de datos debe cumplir.

2.3 ¿Qué son las reglas de Integridad en una Base de Datos Relacional?

Las reglas de integridad en una base de datos permiten que la información almacenada en la misma, posea la consistencia e integridad requerida por sus usuarios. Estas reglas provienen de la definición misma del modelo relacional, pero están dirigidas a que su cumplimiento garantice que los datos sean correctos, o consistentes.

Por su importancia es indispensable que se conozca sobre las mismas, que se definan en la creación de la base de datos, y que el acceso a la base de datos cumpla con ellas. A continuación se presentan las bases del manejo de reglas de integridad, para que se busque su cumplimiento.

Reglas de Integridad Estructurales del Modelo Relacional:

1. Regla de Integridad de Dominio. Hace referencia a que los valores de los datos deben ser atómicos. El dominio de cada atributo debe estar compuesto de valores atómicos, por lo tanto no puede ser un valor compuesto de otros valores más simples, como un arreglo, o un registro de valores. Si se requiere almacenar una dirección por ejemplo, será necesario separar en diferentes atributos, como Calle, número, colonia, ciudad.

2. Regla de Integridad de Llave. Establece que la llave de una entidad debe ser única.

3. Regla de Integridad de entidad: Establece que no se permite un valor nulo como parte de una llave primaria. El valor nulo es permitido para todos los dominios, y se utiliza para cuando el valor del atributo no está definido, o no aplica, y el dominio definido para el atributo lo permite. Por ejemplo, el dominio de NumeroDeEmpleadoDelJefe en la tabla de Empleados, cuando se trabaja en el registro del director de la empresa, y el valor de este número no aplica para el director. Se almacena entonces un NULO.

4. Regla de Integridad referencial: Las referencia de una tabla a otra tabla debe ser con valores de llaves consistentes.

¿Qué significa la regla de Integridad referencial?

La regla de integridad referencial sirve para forzar que las relaciones entre tablas, que se establecen mediante llaves, mantengan siempre datos consistentes entre las mismas.

Las relaciones entre las tablas se establecen entre renglones de una tabla con renglones en la segunda tabla. Estas relaciones se establecen mediante las llaves, donde la llave primaria de una tabla se replica en otra tabla, para establecer la relación. La réplica de la llave primaria en otra tabla, recibe el nombre de llave foránea (foreign key).

¿Qué es una llave foránea?

Una llave foránea (FK) es uno o más atributos en una tabla, que son la llave primaria en otra tabla, inclusive la misma. La llave foránea debe cumplir con:

1. Los atributos que forma la FK deben estar definidos en los mismos dominios que los atributos que forman la PK relacionada a la FK. La condición hace referencia a que los valores deben coincidir entre la FK y la PK, no sobre los nombres de los atributos, por lo cual los nombres en ambas llaves pueden ser diferentes.

2. El valor de la FK en un renglón de la tabla, debe coincidir con un valor de la PK en la otra tabla, o ser un valor NULO. Esto garantiza que la información es consistente entre las tablas que mantienen una relación entre ellas.

Para mostrar estas relaciones en un diagrama, se dibuja una flecha que va de la FK a la PK, mostrando la relación entre ambas tablas. En el siguiente ejemplo se muestra la relación existente entre un Cliente, que tiene una OrdenDeCompra colocada en la empresa.

En general, las reglas de integridad referencial pueden ser definidas entre dos tablas, en cualquier dirección, e inclusive pueden ser definidas entre ocurrencias o renglones de la misma tabla.

Ejemplo: ¿qué relaciones se pueden definir entre un departamento académico y los profesores que trabajan en él?

Un departamento académico se asocia con los diferentes profesores que trabajan en él. Por otro lado un profesor es jefe o director de un departamento académico.

Diseño de un Sistema que utiliza una Base de Datos

El diseño de una base de datos relacional puede seguir diferentes caminos.

La primera opción toma como base la observación del mundo real bajo estudio, generando un conjunto de tablas, que contengan los atributos y las restricciones de integridad sobre las mismas.

Otra opción es dividir el diseño en dos fases:

· definir el modelo conceptual y su esquema

· transformar el esquema conceptual en un esquema relacional mediante un conjunto de reglas de transformación

Aunque la normalización (tema que se cubre posteriormente) es una base muy importante para el diseño de una base de datos, este diseño no puede limitarse a la aplicación exclusiva de la teoría de la normalización.

El diseño de una base de datos, por otro lado, tiene múltiples puntos de vista, y formas de desarrollarse, de acuerdo a esos puntos de vista. Para este curso, la idea del diseño es que se convierta en una proceso práctico, que facilite el proceso de diseño.

En base a esos puntos de vista, un proceso de diseño práctico, incluye las siguientes fases:

Fase 0: Análisis de requerimientos. (No forma parte del proceso de diseño)

Aunque esta fase realmente corresponde a la fase de análisis de un proyecto, se presenta con el fin de establecer que de ésta fase se obtiene la materia prima para el diseño de la base de datos. De esta fase se requiere obtener los requerimientos de datos que el sistema bajo análisis ha formalizado. El documento de análisis, en la parte de requerimientos de datos, es entonces la entrada al proceso de diseño.

Fase 1: Diseño conceptual de la base de datos

Esta fase puede ser considerada tanto parte de la fase de análisis de requerimientos, como parte de la fase de Diseño. Es decir, para algunos puede formar parte del análisis de requerimientos, donde el producto de esta fase es el modelo de datos construido en base a una herramienta específica. Para otros, esta actividad corresponde a la fase de diseño de software, específicamente, del diseño de la base de datos. Para este caso se considera parte del diseño de la base de datos.

Esta fase corresponde a la definición del esquema conceptual, que es el esquema que define el modelo de datos a alto nivel, independiente de cualquier sistema de administración de bases de datos. Por ser un modelo abstracto, no puede utilizarse para definir la estructura de la base de datos.

Fase 2: fase de diseño lógico (Transformación del modelo de datos o esquema conceptual, al SMBD a utilizar).

En esta fase se transforma la salida del diseño conceptual, o esquema conceptual, al esquema de la base de datos en el modelo de datos del DBMS a utilizar.

Fase 3: Diseño de la base de datos física

Consiste en definir las estructuras de almacenamiento y de acceso para alcanzar una rendimiento óptimo de las aplicaciones que se ejecutarán sobre la base de datos. Se tienen diferentes criterios para la definición de la base de datos física: el tiempo de respuesta de ejecución de las aplicaciones y consultas a la base de datos, la utilización del espacio de almacenamiento disponible o el volumen de transacciones por minuto, que se ejecutan sobre la base de datos

Estas fases son genéricas, por lo que deben revisarse para el caso particular de cada empresa.

Posted in:

Jhorge Ibarguen Medellin

miércoles, 5 de octubre de 2011