Data">
BAE - UT1 - Introducción A Las Bases de Datos
BAE - UT1 - Introducción A Las Bases de Datos
BAE - UT1 - Introducción A Las Bases de Datos
UNIDAD 1…
1. INTRODUCCIÓN
Actualmente, en los diversos ámbitos sociales, laborales y culturales, se manejan grandes
cantidades de datos de ahí que haya sido necesario establecer y disponer de unos medios
físicos (hardware) y lógicos (software) que permitan el acceso y la manipulación de la
información de una manera rápida, sencilla y fiable.
Pero echemos la vista atrás unas décadas y veamos la evolución que se ha llevado a cabo.
Si nos remontamos aproximadamente 50 años atrás (sobre finales de los años sesenta), la
información se almacenaba en un conjunto de archivos, los cuáles no tenían ninguna
relación entre sí. Mediante esa organización, los datos que se incluían en un fichero, se
podían repetir en otro fichero, lo cual provocaba una alta existencia o posibilidad de
existencia de que la información se repitiera (duplicara, triplicara…)
A eso se le denomina Información redundante o redundancia.
Vamos a suponer más e indicar que de dicho medicamente solo quedaba 1 existencia, y en
ese instante el vendedor dispensa esa única unidad que queda al cliente, por lo que el
fichero del vendedor se modifica, poniendo que dicho medicamento tendrá como número
de existencias el cero.
¿Pero qué está viendo el administrativo en su fichero? Contemplará que todavía queda una
unidad de dicho medicamento, lo cual ya no es cierto. A este tipo de problemas se le conoce
con el nombre de inconsistencia de la información. Y viene originada por la duplicidad
de ficheros sin ningún control sobre ellos en un momento dado.
En definitivo, por una redundancia de información, la cual es uno de los principales factores
que originan inconsistencias.
2
BASES DE DATOS
Otro detalle vital era el hecho de poder modificar la estructura de un registro que guardaba
información en un fichero. Es decir, si se quería cambiar las características de la información
a almacenar, añadir algún campo nuevo o eliminar alguno, implicaba que las aplicaciones
que utilizaban dichos archivos tenían que modificarse. Esto conllevaba evidentemente
gastos adicionales de recursos como el tiempo y el dinero.
Originaría que habría que cambiar la estructura del archivo para que almacenara los
números más la letra. Pero, ¿la aplicación que usa esa información entendería el nuevo
cambio del DNI con la letra? Tampoco lo entendería y habría que modificar la o las
aplicaciones que usaran ese fichero.
Eso llevaba a que existía una dependencia entre los archivos que almacenaban la
información y las aplicaciones que utilizaban dichos archivos. Había dependencia física y
lógica de datos.
Pero a finales de los años sesenta surgieron las bases de datos. Con ellas se
solucionaron todos los inconvenientes mencionados sobre dependencia de datos. Cualquier
modificación en la estructura de la información a almacenar o en la ubicación de los ficheros
no implicaba el hecho de tener que modificar las aplicaciones que usaban dichos datos.
Se consiguió la independencia física y lógica de los datos.
3
BASES DE DATOS
El código está formado por 12 números y el Nombre por 60 caracteres alfanuméricos. Las
existencias serán 3 dígitos numéricos. La aplicación que utiliza este fichero lee un registro
los 12 primeros caracteres que serán números. Entenderá que ellos son el código. Y el
siguiente carácter que lea entenderá que es el primero de los caracteres que compone el
nombre.
Pero, si cambio la estructura y ahora digo que el código es de 14 caracteres numérico, ¿qué
ocurre? Que cuando lea el decimotercer carácter, la aplicación creerá que estamos en el
campo nombre pero realmente quedan 2 caracteres del campo código.
Este problema es al que nos referimos anteriormente como dependencia lógica de los datos.
¿Y si el fichero lo cambiamos de unidad de almacenamiento? Tenemos la dependencia física.
Estos dos conceptos se resuelven mediante las bases de datos.
EJERCICIO
4
BASES DE DATOS
Resumiendo:
▪ Problemáticas con el manejo de información -> REDUNDANCIA E
INCONSISTENCIA.
▪ Antes de los sesenta -> Utilización de ficheros y los problemas originados eran
la DEPENDENCIA FÍSICA y LÓGICA DE DATOS.
▪ A finales de los sesenta -> BASES DE DATOS y se obtiene INDEPENDENCIA
LÓGICA Y FÍSICA DE DATOS.
▪ Las BASES DE DATOS -> No resuelven la REDUNDANCIA y estas pueden
provocar INCONSISTENCIA.
2. FICHEROS
En un ordenador se almacenan muchos tipos de informaciones, las cuales son de distintos
tipos y características, pudiéndose almacenar en dentro de los distintos tipos de dispositivos
de almacenamiento existentes para un ordenador, como discos duros, CD’s, DVD’s,
Memorias USB, etc…
Los ficheros o archivos son los instrumentos utilizados para organizar la información dentro
de estos dispositivos. ¿Y qué es un fichero o archivo?
Un fichero o archivo es una estructura de información creada por los sistemas operativos
utilizados para poder almacenar los datos que conforman la información.
Estos archivos tienen un nombre y una extensión que determina el formato de la
información que va a contener el archivo o fichero.
2.1 Ficheros
El formato y el tipo de un fichero determinan la forma en qué se va a interpretar la
información que contienen, pues lo único que se va a almacenar realmente es un
conjunto de 0’s y 1’s. El modo en cómo se interprete dicho conjunto de datos
determinará la información final a obtener.
5
BASES DE DATOS
Esta información se ordena de una determinada manera de tal forma que, al leerla, la
aplicación que lee esta información, si es la aplicación correcta, interpretará
adecuadamente que se trata de una imagen JPG y mostrará esa imagen.
Por el contrario, si no se almacena correctamente en el orden establecido o la aplicación
que se utiliza no es la adecuada para su tratamiento, el resultado será un error o que la
imagen es ilegible o incomprensible.
Según su contenido, los ficheros pueden ser binarios o de texto. Según cómo sea la
información que contienen los ficheros será su clasificación. Si la información se
corresponde con datos binarios tendremos un archivo binario. En caso de almacenar
caracteres de tipo texto tendremos que es de texto.
Mediante su organización, los ficheros vienen dirigidos por la forma o manera en cómo
se accede a su información y cómo se manipulan sus datos.
➢ Si los datos se encuentran almacenados en un orden racional en el que un dato se
encuentra detrás de otro, diremos que tenemos un fichero de acceso
secuencial. Tendremos en este caso el gran hándicap que para llegar al último
dato habremos de haber pasado por todos los datos que se encuentren
almacenados.
➢ Si, por el contrario, podemos acceder a un dato en concreto sin tener que pasar
por los demás datos, nos encontraremos ante un fichero de acceso u
organización directo. Para manejar este tipo de ficheros se necesita un
elemento en los datos que sea exclusivo, que no redunde o que no se repita.
➢ Y concluimos con los ficheros indexados, los cuales que simulan un libro con
un índice en su inicio. Mediante ese índice se podrá acceder a un punto concreto
del fichero y, desde ese punto, empezará a recorrer su contenido de manera
secuencial, es decir, un dato detrás de otro. Este tipo de ficheros es una
combinación de los dos anteriores.
Dada la utilidad del fichero, su finalidad, podremos obtener una clasificación, que hoy
en día es la menos usada, de hecho, está casi extinguida, aunque mediante su
nomenclatura sabemos qué tipo de información y cómo se maneja.
6
BASES DE DATOS
Como ejemplos de este tipo tenemos ficheros para configuración, ficheros para copias
de seguridad, ficheros maestros, ficheros de detalles o ficheros históricos.
Unos de los más usados eran los ficheros maestros, ficheros detalles y ficheros
históricos. ¿Quién no ha oído hablar de un fichero en donde se almacenan los accesos a
una determinada web? Estamos ante un fichero histórico.
Y un fichero para almacenar los datos personales de los alumnos, o datos concretos de
productos, o datos sobre películas de manera general, etc. Tendríamos un fichero
maestro.
Y datos de esos alumnos, más detallados, como información sobre estudios, asignaturas,
titulaciones, etc…, es un fichero de detalles.
EJERCICIO
La asignación de los valores numéricos a los caracteres viene dada por una tabla de
asignación. Con un byte se representa un carácter, por lo que habrá 28 caracteres, es
decir, 256 numerados del 0 al 255.
Los ficheros de texto, aunque no necesitan un formato para ser interpretados, suelen
llevar una extensión que identifique qué tipo de texto son, habiendo los siguientes tipos:
○ Ficheros de configuración: Ficheros cuyo contenido es texto que guardan
configuraciones pertenecientes al sistema operativo o una aplicación en concreto:
.ini, .inf, .conf
7
BASES DE DATOS
Generalmente, los ficheros que componen una base de datos son de tipo binario pues la
información que se maneja se encuentra almacenada mediante una estructura
determinada, lógica y organizada para que las aplicaciones puedan acceder de manera
universal.
8
BASES DE DATOS
3. BASES DE DATOS
Veamos varias definiciones para este concepto.
En la primera de ellas definimos una base de datos como un conjunto de datos
interrelacionados y almacenados sin redundancias perjudiciales o innecesarias, las cuáles se
caracterizan por:
o Servir a una o varias aplicaciones de la mejor manera posible.
o Existir independencia entre los datos y los programas que los manejan.
La segunda definición viene a decir que una base de datos es una colección de información
perteneciente a un mismo contexto, que está almacenada de forma organizada en ficheros.
La información almacenada en una base de datos puede ser utilizada a la vez por diferentes
aplicaciones y usuarios y las bases de datos han de permitir métodos para consultar, añadir,
modificar y eliminar datos.
Una base de datos está organizada mediante ficheros o tablas que almacenan información
concerniente a algún objeto o suceso. Estos ficheros o tablas se relacionan formando
relaciones entre ellas.
9
BASES DE DATOS
10
BASES DE DATOS
Los gestores modernos de bases de datos, como Oracle y MySQL entre otros, almacenan
el esquema de la base de datos en tablas de la propia base de datos, haciendo el esquema
totalmente accesible.
11
BASES DE DATOS
o Virus: Los antivirus guardan información sobre todos los potenciales softwares
maliciosos.
o Otros muchos usos: Militares, videojuegos, deportes, etc.
En la década de 1950 se inventan las cintas magnéticas que solo podían ser leídas
secuencial y ordenadamente.
Estas cintas almacenaban ficheros con registros que se procesaban secuencialmente
junto con ficheros de movimientos para generar nuevos ficheros actualizados.
Este sistema se conoce como aplicaciones basadas en sistemas de ficheros. Son la
generación 0 de las bases de datos.
En 1970, IBM publica un artículo donde se define las características del modelo
relacional basado en la lógica de predicados y la teoría de conjuntos.
Nacen así las bases de datos relacionales y con él la famosa base de datos denominada
Oracle.
Dicho modelo se estandariza y se extiende hasta el día de hoy.
El modelo relacional de Codd ha sido y es el más utilizado hasta el momento.
12
BASES DE DATOS
A mediados de 1990, IBM lanza una nueva versión de DB2 que es capaz de dividir una
base de datos enorme colocándola en varios servidores comunicados por líneas de gran
velocidad, creándose de esta forma las bases de datos paralelas.
Se le llamó DB2 Parallel Edition, que ha evolucionado hasta la DB2 Data Partition
Feature, único SGBD (Sistema Gestor de Bases de Datos) de este tipo en sistemas
distribuidos.
13
BASES DE DATOS
14
BASES DE DATOS
Pero todos esos objetivos van enfocados a conseguir el objetivo prioritario de cualquier
base de datos que no es otro que conseguir la independencia física y lógica entre datos y
aplicaciones.
15
BASES DE DATOS
Al usuario se le debe dar una representación de los datos que sea capaz de interpretar y
manejar. No debe ni necesita tener la información que puede manejar un experto
informático.
Según la visión de los datos que se tenga, podemos hablar de 3 niveles que componen
una base de datos y definen la arquitectura de la misma.
16
BASES DE DATOS
Los programas de aplicación solo manejan una parte de la información, trabajan con un
nivel externo.
Para una base de datos específica, hay un único esquema interno y conceptual,
pero pueden existir varios esquemas externos, definidos por uno o varios
usuarios.
Niveles de abstracción de una base de datos
17
BASES DE DATOS
18
BASES DE DATOS
Diccionario de datos.
Es una base de datos donde se almacena toda la descripción de la base de datos,
información referente a la estructura de los datos, relaciones entre ellos, gestión e
implantación de la base de datos.
Este diccionario debe contener todo lo que cualquier usuario quisiera saber:
▪ Las descripciones externa, conceptual e interna de la base de datos.
19
BASES DE DATOS
Lenguajes.
▪ El SGBD ha de proporcionar lenguajes para definir y manipular los
datos de la base de datos.
▪ Estos lenguajes podrán ser utilizados por administradores y usuarios.
Son los siguientes:
➢ Lenguaje de Definición de Datos (Data Definition Language).
Se utiliza para definir el esquema conceptual y los distintos
subesquemas externos de la base de datos.
Ejemplo.
Instrucciones como CREATE TABLE, ALTER TABLE o
DROP VIEW.
20
BASES DE DATOS
Son lenguajes de gramática sencilla en la que cada SGBD ha puesto sus propias
características en las sintaxis, fundamentalmente en los DML y DDL.
4.3.Tipos de SGBD
Los SGBD se pueden clasificar de muchas formas.
Según qué gestionan, según sean bases de datos relacionales o bases de datos orientadas
a objetos.
21
BASES DE DATOS
Ejemplos de bases de datos jerárquicas son el IMS de IBM y el SYSTEM 2000 de Intel.
A continuación, mostramos un ejemplo/ejercicio práctico de este modelo.
22
BASES DE DATOS
23
BASES DE DATOS
Ejemplo.
Fecha = Año+Mes+Dia
o Conjunto: Un conjunto relaciona dos tipos de registro. Uno de ellos se llama
propietario y el otro, miembro.
Ejemplo.
PROVEEDOR
Cod_Pro Nombre
ARTÍCULOS
Cod_Art Nombre
El registro propietario en la Figura 1.5., Proveedor con código 10, apunta hacia el primer
registro miembro, Artículo con código 101.
Este al segundo registro miembro, Artículo con código 102, y así sucesivamente hasta el
último registro miembro que apuntará al registro propietario.
24
BASES DE DATOS
Ejemplos de este tipo de bases de datos son el DMS 1100 de UNIVAC o el DBOMP de
IBM.
6. ARQUITECTURA CLIENTE-SERVIDOR
La arquitectura Cliente/Servidor ha ido evolucionando en conjunción con los avances
hardware y software que se han ido dando en el mundo de la informática como son la
aparición de las nuevas tecnologías de almacenamiento, la mejora de las comunicaciones
por red y la mejora en las tecnologías de las bases de datos.
Normalmente, el Servidor es un potente ordenador que actúa como depósito de los datos y
permite llevar a cabo todas las funciones de un SGBD.
Los Clientes son estaciones de trabajo u ordenadores personales que solicitan servicios al
Servidor.
25
BASES DE DATOS
Aparte de estos componentes, existen otros que existen tanto en el Cliente como en el
Servidor. Software de Sistemas Operativos en Red, de Aplicaciones de Bases de Datos, de
Comunicaciones, etc… que facilitan la conexión entre Servidor y Cliente.
26
BASES DE DATOS
27
BASES DE DATOS
28
BASES DE DATOS
➢ Definir controles de
autorización para que se
apliquen cada vez que se
intente el acceso a datos
sensibles
o Puede conservarse la
integridad.
➢ Que los datos se
encuentren en una sola
máquina ayuda a evitar la
inconsistencia de los datos.
29