Resumen Capitulo 6 COMPLETO
Resumen Capitulo 6 COMPLETO
Resumen Capitulo 6 COMPLETO
de
datos
que
una
informacin precisa
Registro:Un grupo de campos relacionados, como el nombre del estudiante, el curso que va a
tomar, la fecha y la calificacin. Un registro describe a una entidad. Una entidad es una persona,
lugar, cosa o evento sobre el cual almacenamos y mantenemos informacin. Cada caracterstica
o cualidad que describe a una entidad especfica se denomina atributo. Por
ejemplo,ID_Estudiante, Curso, Fecha y Calificaciones son atributos de la entidad CURSO
Archivo:un grupo de registros del mismo tipo
Base de datos:Un grupo de archivos relacionados
PROBLEMAS CON EL ENTORNO DE ARCHIVOS TRADICIONAL
En la mayora de las organizaciones, los sistemas tendan a crecer de manera independiente sin
un plan a nivel de toda la compaa. Contabilidad, finanzas, manufactura, recursos humanos,
ventas y marketing han desarrollado sus propios sistemas y archivos de datos. Con esto es
posible encontrar los siguientes problemas:
Redundancia e inconsistencia de los datos
La redundancia de los datos es la presencia de datos duplicados en varios archivos, de modo que
se almacenen los mismos datos en ms de un lugar o ubicacin. La inconsistencia de los datos
ocurre cuando el mismo atributo puede tener distintos valores.
Dependencia programa-datos
Se refiere al acoplamiento de los datos almacenados en archivos y los programas especficos
requeridos para actualizar y dar mantenimiento a esos archivos, de tal forma que los cambios en
los programas requieran cambios en los datos. Tal vez un programa se modifique de un cdigo
postal de cinco dgitos a nueve. Si el archivo de datos original se cambiara para usar cdigos
postales de nueve dgitos en vez de cinco, entonces otros programas que requirieran el cdigo
postal de cinco dgitos ya no funcionaran en forma apropiada
Falta de flexibilidad
Un sistema de archivos tradicional puede entregar informes programados de rutina despus de
cierto esfuerzo extenso de programacin, pero no puede entregar informes adhoc ni responder
de manera oportuna a los requerimientos de informacin no anticipados.La informacin
requerida por las solicitudes ad hoc est en alguna parte del sistema, pero tal vez sea demasiado
costoso recuperarla
Seguridad defectuosa
Como hay poco control o poca administracin de los datos, el acceso a la informacin, as como
su diseminacin, pueden estar fuera de control. La gerencia tal vez no tenga forma de saber
quin est accediendo a los datos de la organizacin, o incluso modificndolos.
Falta de comparticin y disponibilidad de los datos
Como las piezas de informacin en los distintos archivos y las diferentes partes de la
organizacin no se pueden relacionar entre s, es casi imposible compartir o acceder a la
informacin de una manera oportuna. La informacin no puede fluir con libertad entre reas
funcionales o partes de la organizacin distintas
6.2. LA METODOLOGA DE LAS BASES DE DATOS PARA LA ADMINISTRACIN DE DATOS
La tecnologa de las bases de datos resuelve muchos de los problemas de la organizacin de
los archivos tradicionales. Una definicin ms rigurosa de una base de datoses la de una
coleccin de datos organizados para dar servicio a muchas aplicaciones de manera eficiente, al
centralizar los datos y controlar los que son redundantes.En vez de guardar los datos en archivos
separados para cada aplicacin, se almacenan de modo que los usuarios crean que estn en una
sola ubicacin.
clave primaria. Este campo clave es el identificador nico para toda la informacin en cualquier
fila de la tabla y su clave primaria no puede estar duplicada (Numero_Proveedor es la clave
primaria para la tabla PROVEEDOR yNumero_Pieza es la clave primaria para la tabla PIEZA).
Observe que Numero_Proveedoraparece tanto en la tabla PROVEEDOR como en PIEZA. En la
tabla PROVEEDOR, Numero_Proveedor es la clave primaria. Cuando el campo Numero_Proveedor
apareceen la tabla PIEZA se denomina clave fornea, la cual es en esencia un campo de
bsquedapara averiguar datos sobre el proveedor de una pieza especfica.
Operaciones de un DBMS relacional
Las tablas de bases de datos relacionales se pueden combinar con facilidad para ofrecer los
datos requeridos por los usuarios, siempre y cuando dos tablas cualesquiera compartan un
elemento de datos comn. Suponga que queremos encontrar en estabase de datos los nombres
de los proveedores que nos puedan suministrar el nmerode pieza 137 o el 150. Necesitaramos
informacin de dos tablas: la tabla PROVEEDORy la tabla PIEZA. Observe que estos dos archivos
tienen un elemento de datos compartido:Numero_Proveedor.En una base de datos relacional se
utilizan tres operaciones bsicas, como se muestraen la figura 6-5, para desarrollar conjuntos
tiles de datos: seleccionar, unir y proyectar.La operacin seleccionar crea un subconjunto que
consiste en todos los registrosdel archivo que cumplan con criterios establecidos. En otras
palabras, la seleccincrea un subconjunto de filas que cumplen con ciertos criterios. En nuestro
ejemplo,queremos seleccionar registros (filas) de la tabla PIEZA en donde el Numero_Piezasea
igual a 137 o 150. La operacin unir combina tablas relacionales para proveer alusuario ms
informacin de la que est disponible en las tablas individuales. En nuestroejemplo, queremos
unir la tabla PIEZA, que ya est recortada (slo se presentarnlas piezas 137 o 150), con la tabla
PROVEEDOR en una sola tabla nueva.La operacin proyectar crea un subconjunto que consiste
de columnas en una tabla, con lo cual el usuario puede crear nuevas tablas que contengan slo
El diseo conceptual de la base describe la forma en que se deben agrupar los datos,
identificando la relacin entre ellos y la mejor manera de agruparlos. Se deben identificar
tambin los elementos redundantes (y minimizarlos) y las formas de agrupar datos que
requieren los programas que se utilizarn. Luego estos grupos de datos se organizan y la base de
datos cobra una vista lgica. El proceso de crear estructuras de datos pequeas y estables pero
a la vez flexibles y adaptivas a partir de grupos complejos de datos se denomina normalizacin.
Ejemplo de las tablas: En la empresa especfica que se modela aqu, un pedido puede tener ms
de una pieza, pero cada una slo es proporcionada por un proveedor.
Si creamos una relacin llamada PEDIDO con todos los campos que se incluyen aqu, tendramos
que repetir el nombre y la direccin del proveedor para cada pieza del pedido, aun y cuando ste
sea de piezas de un solo proveedor (grupos de datos repetitivos).
Los sistemas de bases de datos relacionales tratan de cumplir reglas de integridad referencial
para asegurar que las relaciones entre las tablas acopladas permanezcan consistentes. Cuando
una tabla tiene una clave fornea que apunta a otra, no es posible agregar un registro a la tabla
con la clave fornea a menos que haya uno correspondiente en la tabla vinculada.
Ejemplo: La clave fornea Numero_Proveedor vincula la tabla PIEZA con la tabla PROVEEDOR. No
podemos agregar un nuevo registro a la tabla PIEZA para una pieza con el Numero_Proveedor
8266 a menos que haya un registro correspondiente en la tabla PROVEEDOR para el
Numero_Proveedor 8266 (lo mismo si se quiere quitar un registro).
Los diseadores de bases de datos documentan su modelo de datos con un diagrama entidadrelacin. Los cuadros representan las entidades, y las lneas que conectan los cuadros, las
relaciones. Una lnea que conecta dos entidades que termina en dos marcas cortas designa una
relacin de uno a uno. Una lnea que conecta dos entidades y termina con una pata de cuervo y
una marca corta encima de ella indica una relacin de uno a varios.
Un PEDIDO puede contener varios ARTICULO_ LINEA. Cada PIEZA slo puede tener un
PROVEEDOR, pero muchos elementos PIEZA pueden ser proporcionados por el mismo
PROVEEDOR.
TOMA DE DECISIONES
Las empresas usan las bases de datos para registrar las transacciones con proveedores, clientes
y empleados. Pero tambin sirven para ayudar a llevar los negocios y en la toma de decisiones .
ALMACENES DE DATOS
Si se desea informacin concisa y confiable acerca de operaciones o tendencias de la compaa,
a veces esto resulta difcil, ya que con frecuencia los datos se mantienen en sistemas separados,
por ejemplo por departamento, como consecuencia del uso de tecnologas obsoletas.
Un almacn de datos es una base de datos que almacena la informacin actual e histrica de
inters potencial para los encargados de tomar decisiones en la compaa. Los datos se originan
en muchos sistemas (de transacciones operacionales) bsicos. El almacn de datos consolida y
estandariza la informacin de distintas bases de datos operacionales.
ste almacn pone los datos a disposicin de cualquiera que los necesite, pero no se pueden
alterar. Un sistema de almacn de datos tambin provee un rango de herramientas de consulta
estandarizadas, herramientas analticas y facilidades de informes grficos. Muchas empresas
usan portales de intranets para que la informacin del almacn de datos est disponible en toda
la empresa.
Mercados de datos
A veces las organizaciones crean un almacn de datos central que da servicio a toda la
organizacin o crean almacenes pequeos y descentralizados conocidos como mercados de
datos. Un mercado de datos es un subconjunto de un almacn de datos e incluye datos de
alto grado de enfoque y se ponen en una base de datos separada para una poblacin especfica
de usuarios.
Por ejemplo, una compaa podra desarrollar mercados de datos sobre marketing y ventas para
lidiar con la informacin de los clientes. Por lo general, un mercado de datos se enfoca en un solo
tema o lnea de negocios, por lo que es comn que se construya con ms rapidez y a un menor
costo que un almacn de datos a nivel empresarial.
Minera de datos
Las consultas en las bases de datos tradicionales responden a preguntas como: Cuntas
unidades del producto nmero 403 se enviaron en febrero de 2010? El OLAP (anlisis
multidimensional) soporta solicitudes mucho ms complejas de informacin, como: Comparar
las ventas del producto 403 relativas con el plan por trimestre y la regin de ventas durante los
ltimos dos aos. Con OLAP y el anlisis de datos orientados a consultas, los usuarios necesitan
tener una buena idea sobre la informacin que estn buscando.
La minera de datos est ms orientada al descubrimiento, ya que provee perspectivas hacia
los datos corporativos que no se pueden obtener mediante OLAP, al encontrar patrones y
relaciones ocultas en las bases de datos grandes e inferir reglas a partir de estos patrones y
relaciones, para predecir el comportamiento a futuro.
Los tipos de informacin que se pueden obtener de la minera de datos son:
Secuencias: Los eventos se vinculan en el transcurso del tiempo. Por ejemplo, podramos
descubrir que si se compra una casa, el 65 por ciento del tiempo se compra un nuevo
refrigerador dentro de las siguientes dos semanas, y el 45 por ciento se compra un horno
dentro del mes.
tarjetas bancarias o particionar una base de datos en grupos de clientes con base en la
demografa.
El anlisis predictivo utiliza las tcnicas de minera de datos, los datos histricos y las
suposiciones sobre las condiciones futuras para predecir los resultados de los eventos, como la
probabilidad de que un cliente responda a una oferta o que compre un producto especfico.
Minera de datos y minera Web
El correo electrnico, los memorndums, las transcripciones de los call centers, las respuestas a
las encuestas, los casos legales, las descripciones de patentes y los informes de servicio son
todos elementos valiosos para encontrar patrones y tendencias que ayuden a los empleados a
tomar mejores decisiones de negocios.
En la actualidad hay herramientas de minera de texto disponibles para ayudar a las empresas
a analizar estos datos. Estas herramientas pueden extraer elementos clave de los conjuntos de
datos extensos no estructurados, descubrir patrones y relaciones, as como sintetizar la
informacin. Las empresas podran recurrir a la minera de texto para analizar las transcripciones
de los call centers de servicio al cliente para identificar las principales cuestiones de servicio y
reparacin.
La Web es otra fuente extensa de informacin valiosa, y parte de sta se puede explotar en
busca de patrones, tendencias y perspectivas en relacin con el comportamiento de los clientes.
El descubrimiento y anlisis de los patrones tiles y la informacin proveniente de World Wide
Web se denominan minera Web. Las empresas podran recurrir a la minera Web para que les
ayude a comprender el comportamiento de los clientes, evaluar la efectividad de un sitio Web
especfico o cuantificar el xito de una campaa de marketing.
LAS BASES DE DATOS Y WEB
Suponga por ejemplo que un cliente con un navegador Web desea buscar informacin de precios
en la base de datos en lnea de un vendedor minorista. El usuario accede al sitio Web del
vendedor a travs de Internet mediante el software de navegador Web en su PC cliente. El
software de navegador Web del usuario solicita informacin a la base de datos de la
organizacin, mediante comandos de HTML para comunicarse con el servidor Web. Como
muchas bases de datos de procesamiento en segundo plano (back-end) no pueden interpretar
comandos escritos en HTML, el servidor Web pasa estas solicitudes de datos al software que
traduce los comandos de HTML en SQL, de modo que el DBMS que trabaja con la base de datos
pueda procesarlos. En un entorno cliente/servidor, el DBMS reside en una computadora dedicada
llamada servidor de bases de datos. El DBMS recibe las solicitudes de SQL y provee los datos
requeridos. El middleware transforma la informacin de la base de datos interna y la devuelve al
servidor Web para que la ofrezca en forma de una pgina Web al usuario.
Hay varias ventajas en cuanto al uso de Web para acceder a las bases de datos internas de una
organizacin. En primer lugar, el software de navegador Web es mucho ms fcil de usar que las
herramientas de consulta propietarias. En segundo lugar, la interfaz Web requiere pocos o
ningn cambio en la base de datos interna. Es mucho menos costoso agregar una interfaz Web
frente a un sistema heredado que redisear y reconstruir el sistema para mejorar el acceso de
los usuarios.
El acceso a las bases de datos corporativas por medio de Web est creando nuevas eficiencias,
oportunidades y modelos de negocios, Otras compaas han creado empresas totalmente
nuevas con base en el acceso a bases de datos extensas a travs de Web.
la captura de los datos. La incidencia de dichos errores aumenta a medida que las compaas
pasan sus negocios a Web y permiten que los clientes y proveedores introduzcan datos en sus
sitios Web para actualizar de manera directa los sistemas internos.
Con frecuencia, el anlisis de la calidad de los datos empieza con una auditora de calidad de
los datos, la cual es una encuesta estructurada de la precisin y el nivel de su integridad en un
sistema de informacin. Las auditoras de calidad de los datos se pueden realizar mediante la
inspeccin de los archivos de datos completos, la inspeccin de muestras provenientes de los
archivos de datos, o mediante encuestas a los usuarios finales sobre sus percepciones en cuanto
a la calidad de los datos.
La limpieza de datos, conocida tambin en ingls como data scrubbing, consiste en
actividades para detectar y corregir datos en una base que sean incorrectos, incompletos, que
tengan un formato inapropiado o que sean redundantes. La limpieza de datos no slo corrige los
errores, sino que tambin impone la consistencia entre los distintos conjuntos de datos que se
originan en sistemas de informacin separados.
RESUMEN DE REPASO
1. Cules son los problemas de administrar los recursos de datos en un entorno de
archivos tradicional y cmo se resuelven mediante un sistema de administracin de
bases de datos?
Las tcnicas tradicionales de administracin de archivos dificultan a las organizaciones el
proceso de llevar el registro de todas las piezas de datos que utilizan de una manera sistemtica,
y de organizarlos de modo que se pueda tener un fcil acceso a ellos. Se permiti a las distintas
reas y grupos funcionales desarrollar sus propios archivos en forma independiente. Con el
tiempo, este entorno tradicional de administracin de archivos crea problemas como la
redundancia e inconsistencia de los datos, la dependencia programa-datos, inflexibilidad, mala
seguridad, falta de comparticin y disponibilidad de stos. Un sistema de administracin de
bases de datos (DBMS) resuelve estos problemas mediante software que permite su
centralizacin y administracin, de modo que las empresas tengan una sola fuente consistente
para todas sus necesidades de datos. El uso de un DBMS minimiza la cantidad de archivos
redundantes e inconsistentes.
manipularlo. Las tablas de las bases de datos relacionales se pueden combinar con facilidad para
ofrecer los datos que requieren los usuarios, siempre y cuando dos tablas cualesquiera
compartan un elemento de datos comn.
3. Cules son algunos principios importantes del diseo de bases de datos?
Para disear una base de datos se requieren un diseo lgico y uno fsico. El diseo lgico
modela la base de datos desde una perspectiva de negocios. El modelo de datos de la
organizacin debe reflejar sus procesos de negocios clave y los requerimientos para la toma de
decisiones. El proceso de crear estructuras de datos pequeas, estables, flexibles y adaptativas a
partir de grupos complejos de datos al momento de disear una base de datos relacional se
denomina normalizacin. Una base de datos relacional bien diseada no debe tener relaciones
de varios a varios, y todos los atributos para una entidad especfica slo se aplican a esa
entidad. Esta base de datos trata de imponer las reglas de integridad referencial para asegurar
que las relaciones entre tablas acopladas permanezcan consistentes. Un diagrama entidadrelacin describe en forma grfica la relacin entre las entidades (tablas) en una base de datos
relacional.