Nothing Special   »   [go: up one dir, main page]

Resumen Capitulo 6 COMPLETO

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 13

6.

FUNDAMENTOS DE INTELIGENCIA DE NEGOCIOS: BASES DE DATOS Y


ADMINISTRACIN DE LA INFORMACIN
Caso de Introduccin: RR DONNELLEY TRATA DE DOMINAR SUS DATOS
RR Donnelley es una compaa que provee servicios de impresin, formularios, etiquetas, correo
directo y otros servicios. Sus ingresos crecieron considerablemente en los ltimos 10 aos lo que
gener desafos en cuanto a la administracin de la informacin.
Cada compaa adquirida tena sus propios sistemas, conjunto de datos de clientes,
distribuidores y productos. Al provenir de tantas fuentes distintas, con frecuencia los datos eran
inconsistentes, duplicados o incompletos. Estas condiciones aumentaron ineficiencias y costos
Para resolver este problema, RR Donnelley recurri a la administracin de datos maestros (MDM).
El objetivo de la MDM es asegurar que una organizacin no utilice varias versiones de la misma
pieza de datos en distintas partes de sus operaciones, para lo cual fusiona los registros dispares
en un solo archivo maestro autenticado. La implementacin de la MDM es un proceso de varios
pasos que incluye el anlisis de los procesos de negocios, la
limpieza de
los datos, la consolidacin, reconciliacin de los datos y la
migracin de datos hacia un archivo
maestro de toda la informacin de la
compaa. Al tener un solo conjunto
consistente a nivel empresarial de datos
con
definiciones y estndares comunes, la
gerencia puede averiguar con facilidad
qu tipo de negocios y qu tanta
actividad comercial tiene con un
cliente especfico para identificar los
mejores clientes y las oportunidades de
ventas. Y cuando Donnelley adquiera una compaa, podr ver con
rapidez una lista
de los clientes que se traslapen.
6.1. ORGANIZACIN DE LOS DATOS EN UN ENTORNODE ARCHIVOS TRADICIONAL
Sistema de informacin:provee a los usuarios
(sin errores), oportuna (oportuna cuando est
disponible para los encargados de tomar decisiones en el momento
en que la necesitan) y relevante (cuando es til y
apropiada tanto para los tipos de trabajos como para las
decisiones que la requieren)
TRMINOS Y CONCEPTOS DE ORGANIZACIN DE ARCHIVOS
Un sistema computacional organiza los datos en una
jerarqua que empieza con bits y bytes, y progresa hasta
llegar a los campos, registros, archivos y bases de datos.
Bit:la unidad ms pequea
computadora puede manejar

de

datos

que

una

Byte:grupo de bits que representa a un solo carcter.


Puede ser una letra, un nmero u otro smbolo.
Campo:Un agrupamiento de caracteres en una palabra,
un conjunto de palabras o un nmero completo (como el
nombre o la edad de una persona)

informacin precisa

Registro:Un grupo de campos relacionados, como el nombre del estudiante, el curso que va a
tomar, la fecha y la calificacin. Un registro describe a una entidad. Una entidad es una persona,
lugar, cosa o evento sobre el cual almacenamos y mantenemos informacin. Cada caracterstica
o cualidad que describe a una entidad especfica se denomina atributo. Por
ejemplo,ID_Estudiante, Curso, Fecha y Calificaciones son atributos de la entidad CURSO
Archivo:un grupo de registros del mismo tipo
Base de datos:Un grupo de archivos relacionados
PROBLEMAS CON EL ENTORNO DE ARCHIVOS TRADICIONAL
En la mayora de las organizaciones, los sistemas tendan a crecer de manera independiente sin
un plan a nivel de toda la compaa. Contabilidad, finanzas, manufactura, recursos humanos,
ventas y marketing han desarrollado sus propios sistemas y archivos de datos. Con esto es
posible encontrar los siguientes problemas:
Redundancia e inconsistencia de los datos
La redundancia de los datos es la presencia de datos duplicados en varios archivos, de modo que
se almacenen los mismos datos en ms de un lugar o ubicacin. La inconsistencia de los datos
ocurre cuando el mismo atributo puede tener distintos valores.
Dependencia programa-datos
Se refiere al acoplamiento de los datos almacenados en archivos y los programas especficos
requeridos para actualizar y dar mantenimiento a esos archivos, de tal forma que los cambios en
los programas requieran cambios en los datos. Tal vez un programa se modifique de un cdigo
postal de cinco dgitos a nueve. Si el archivo de datos original se cambiara para usar cdigos
postales de nueve dgitos en vez de cinco, entonces otros programas que requirieran el cdigo
postal de cinco dgitos ya no funcionaran en forma apropiada
Falta de flexibilidad
Un sistema de archivos tradicional puede entregar informes programados de rutina despus de
cierto esfuerzo extenso de programacin, pero no puede entregar informes adhoc ni responder
de manera oportuna a los requerimientos de informacin no anticipados.La informacin
requerida por las solicitudes ad hoc est en alguna parte del sistema, pero tal vez sea demasiado
costoso recuperarla
Seguridad defectuosa
Como hay poco control o poca administracin de los datos, el acceso a la informacin, as como
su diseminacin, pueden estar fuera de control. La gerencia tal vez no tenga forma de saber
quin est accediendo a los datos de la organizacin, o incluso modificndolos.
Falta de comparticin y disponibilidad de los datos
Como las piezas de informacin en los distintos archivos y las diferentes partes de la
organizacin no se pueden relacionar entre s, es casi imposible compartir o acceder a la
informacin de una manera oportuna. La informacin no puede fluir con libertad entre reas
funcionales o partes de la organizacin distintas
6.2. LA METODOLOGA DE LAS BASES DE DATOS PARA LA ADMINISTRACIN DE DATOS
La tecnologa de las bases de datos resuelve muchos de los problemas de la organizacin de
los archivos tradicionales. Una definicin ms rigurosa de una base de datoses la de una
coleccin de datos organizados para dar servicio a muchas aplicaciones de manera eficiente, al
centralizar los datos y controlar los que son redundantes.En vez de guardar los datos en archivos
separados para cada aplicacin, se almacenan de modo que los usuarios crean que estn en una
sola ubicacin.

SISTEMAS DE ADMINISTRACIN DE BASES DE DATOS


Un Sistema de Administracin de Bases de Datos (DBMS) es software que permite a una
organizacin centralizar los datos, administrarlos en forma eficiente y proveer acceso a los datos
almacenados mediante programas de aplicacin. El DBMS acta como una interfaz entre los
programas de aplicacin y los archivos de datos fsicos.
El DBMS libera al programador o al usuario final de la tarea de comprender en dnde y cmo
estn almacenados los datos en realidad, al separar las vistas lgica y fsica de los datos. La
vista lgica presenta los datos segn la manera en que los perciben los usuarios finales o los
especialistas de negocios, mientras que la vista fsicamuestra la verdadera forma en que estn
organizados y estructurados los datos en los medios de almacenamiento fsicos.
Cmo resuelve un DBMS los problemas del entorno de archivos tradicionales
Un DBMS reduce la redundancia e inconsistencia de los datos al minimizar los archivosaislados
en los que se repiten los mismos datos. Incluso si la organizacin mantiene ciertos datos
redundantes, el uso de un DBMS elimina la inconsistencia de los datos debido a que puede
ayudar a la organizacin a asegurar que cada ocurrencia de datos redundantes tenga los mismos
valores. El DBMS desacopla los programas y los datos, con lo cual estos ltimos se pueden
independizar. Tambin permite a la organizacin administrar los datos, su uso y suseguridad en
forma central.
DBMS relacional
Las bases de datos relacionales representan los datos como tablas bidimensionales (llamadas
relaciones), a las cuales se puede hacer referencia como si fueran archivos. Cada tabla contiene
datos sobre una entidad y sus atributos. Microsoft Access es un DBMS relacional para sistemas
de escritorio
Veamos ahora cmo
organiza una base de
datos relacional la
informacin sobre proveedores y
piezas (vea la figura
6-4). La base de datos
tiene
una
tabla
separada parala entidad
PROVEEDOR y una para
la entidad PIEZA. Cada
elemento individual de
datos para cada entidad
se almacena como un
campo separado, y cada
campo representa un atributo para
esa
entidad. Los campos en una base de
datos
relacionales
tambin
se
llaman
columnas. Para
la entidad PROVEEDOR, el nmero de
identificacin
de proveedor, nombre, calle, ciudad,
estado y cdigo
postal se almacenan como campos
separados
dentro de la tabla PROVEEDOR y cada
campo
representa un atributo para la entidad
PROVEEDOR.
La informacin real sobre un solo
proveedor que
reside en una tabla se denomina fila.
Por lo general
las filas se conocen como registros, o
en trminos muy
tcnicos, como tuplas.
El campo para Nombre_Proveedor en la tabla PROVEEDOR identifica a cada registro en forma
nica, de modo que ese registro se pueda recuperar, actualizar u ordenar, y se denomina campo
clave. Cada tabla en una base de datos relacional tiene un campo que se designa como su

clave primaria. Este campo clave es el identificador nico para toda la informacin en cualquier
fila de la tabla y su clave primaria no puede estar duplicada (Numero_Proveedor es la clave
primaria para la tabla PROVEEDOR yNumero_Pieza es la clave primaria para la tabla PIEZA).
Observe que Numero_Proveedoraparece tanto en la tabla PROVEEDOR como en PIEZA. En la
tabla PROVEEDOR, Numero_Proveedor es la clave primaria. Cuando el campo Numero_Proveedor
apareceen la tabla PIEZA se denomina clave fornea, la cual es en esencia un campo de
bsquedapara averiguar datos sobre el proveedor de una pieza especfica.
Operaciones de un DBMS relacional
Las tablas de bases de datos relacionales se pueden combinar con facilidad para ofrecer los
datos requeridos por los usuarios, siempre y cuando dos tablas cualesquiera compartan un
elemento de datos comn. Suponga que queremos encontrar en estabase de datos los nombres
de los proveedores que nos puedan suministrar el nmerode pieza 137 o el 150. Necesitaramos
informacin de dos tablas: la tabla PROVEEDORy la tabla PIEZA. Observe que estos dos archivos
tienen un elemento de datos compartido:Numero_Proveedor.En una base de datos relacional se
utilizan tres operaciones bsicas, como se muestraen la figura 6-5, para desarrollar conjuntos
tiles de datos: seleccionar, unir y proyectar.La operacin seleccionar crea un subconjunto que
consiste en todos los registrosdel archivo que cumplan con criterios establecidos. En otras
palabras, la seleccincrea un subconjunto de filas que cumplen con ciertos criterios. En nuestro
ejemplo,queremos seleccionar registros (filas) de la tabla PIEZA en donde el Numero_Piezasea
igual a 137 o 150. La operacin unir combina tablas relacionales para proveer alusuario ms
informacin de la que est disponible en las tablas individuales. En nuestroejemplo, queremos
unir la tabla PIEZA, que ya est recortada (slo se presentarnlas piezas 137 o 150), con la tabla
PROVEEDOR en una sola tabla nueva.La operacin proyectar crea un subconjunto que consiste
de columnas en una tabla, con lo cual el usuario puede crear nuevas tablas que contengan slo

la informacin requerida. En nuestro ejemplo queremos extraer de la nueva tabla slo


lassiguientes columnas: Numero_Pieza, Nombre_Pieza, Numero_Proveedor y Nombre_Proveedor.
DBMS orientado a objetos
Los DBMS diseados para organizar datos estructurados en filas y columnas no se adaptan bien
al manejo de aplicaciones basadas en grficos o multimedia. Las bases de datos orientadas a
objetos son ms adecuadas para este propsito.
Un DBMS orientado a objetos almacena los datos y los procedimientos que actan sobre esos
datos como objetos que se pueden recuperar y compartir de manera automtica. Aunque stas
pueden almacenar tipos ms complejos de informacin que los DBMS relacionales, son lentos en
comparacin con losDBMS relacionales para procesar grandes nmeros de transacciones. Ahora
hay sistemas DBMS objeto-relacional hbridos, que ofrecen las capacidades de los sistemas
DBMS tanto orientados a objetos como relacionales.

Bases de datos en la nube


Suponga que su compaa desea utilizar los servicios de computacin en la nube. Hay alguna
forma de administrar los datos en la nube? La respuesta es un "s" condicional. Los proveedores
de computacin en la nube ofrecen servicios de administracin de bases de datos, pero por lo
general estos servicios tienen menos funcionalidad que sus contrapartes dentro de las premisas
de la empresa.
CAPACIDADES DE LOS SISTEMAS DE ADMINISTRACIN DE BASES DE DATOS
Los DBMS tienen una capacidad de definicin de datospara especificar la estructura del
contenido de la base de datos. Podra usarse para crear tablas de bases de datos y definir las
caractersticas de los campos en cada tabla. Esta informacin sobre la base de datos se puede
documentar en un diccionario de datos, el cual es un archivo automatizado o manual que
almacena las definiciones de los elementos de datos y sus caractersticas.
Consultas e informes
Un DBMS contiene herramientas para acceder a la informacin en las bases de datos y
manipularla. La mayora de los DBMS tienen un lenguaje especializado conocido como lenguaje
de manipulacin de datos el cual se utiliza para agregar, modificar, eliminar y recuperar los
datos en la base. Este lenguaje contiene comandos que permiten a los usuarios finales y a los
especialistas de programacin extraer los datos de la base para satisfacer las solicitudes de
informacin y desarrollar aplicaciones. El lenguaje de manipulacin de datos ms prominente en
la actualidad es el lenguaje de consulta estructurado, o SQL.

DISEO DE BASES DE DATOS


Para crear una base de datos hay que entender la relacione entre la informacin, el tipo de
datos, la forma de utilizarlos y los cambios que se deben hacer en la organizacin a partir de
estos datos.
La base de datos requiere tanto de un diseo conceptual/lgico (modelo abstracto desde
perspectiva de negocios) como de uno fsico (disposicin de la base en dispositivos de
almacenamiento).
Diagramas de normalizacin y de entidad-relacin

El diseo conceptual de la base describe la forma en que se deben agrupar los datos,
identificando la relacin entre ellos y la mejor manera de agruparlos. Se deben identificar
tambin los elementos redundantes (y minimizarlos) y las formas de agrupar datos que
requieren los programas que se utilizarn. Luego estos grupos de datos se organizan y la base de
datos cobra una vista lgica. El proceso de crear estructuras de datos pequeas y estables pero
a la vez flexibles y adaptivas a partir de grupos complejos de datos se denomina normalizacin.
Ejemplo de las tablas: En la empresa especfica que se modela aqu, un pedido puede tener ms
de una pieza, pero cada una slo es proporcionada por un proveedor.

Si creamos una relacin llamada PEDIDO con todos los campos que se incluyen aqu, tendramos
que repetir el nombre y la direccin del proveedor para cada pieza del pedido, aun y cuando ste
sea de piezas de un solo proveedor (grupos de datos repetitivos).

Los sistemas de bases de datos relacionales tratan de cumplir reglas de integridad referencial
para asegurar que las relaciones entre las tablas acopladas permanezcan consistentes. Cuando
una tabla tiene una clave fornea que apunta a otra, no es posible agregar un registro a la tabla
con la clave fornea a menos que haya uno correspondiente en la tabla vinculada.
Ejemplo: La clave fornea Numero_Proveedor vincula la tabla PIEZA con la tabla PROVEEDOR. No
podemos agregar un nuevo registro a la tabla PIEZA para una pieza con el Numero_Proveedor
8266 a menos que haya un registro correspondiente en la tabla PROVEEDOR para el
Numero_Proveedor 8266 (lo mismo si se quiere quitar un registro).
Los diseadores de bases de datos documentan su modelo de datos con un diagrama entidadrelacin. Los cuadros representan las entidades, y las lneas que conectan los cuadros, las
relaciones. Una lnea que conecta dos entidades que termina en dos marcas cortas designa una
relacin de uno a uno. Una lnea que conecta dos entidades y termina con una pata de cuervo y
una marca corta encima de ella indica una relacin de uno a varios.

Un PEDIDO puede contener varios ARTICULO_ LINEA. Cada PIEZA slo puede tener un
PROVEEDOR, pero muchos elementos PIEZA pueden ser proporcionados por el mismo
PROVEEDOR.

USO DE BASES DE DATOS PARA MEJORAR EL DESEMPEO DE NEGOCIOS Y LA

TOMA DE DECISIONES
Las empresas usan las bases de datos para registrar las transacciones con proveedores, clientes
y empleados. Pero tambin sirven para ayudar a llevar los negocios y en la toma de decisiones .

ALMACENES DE DATOS
Si se desea informacin concisa y confiable acerca de operaciones o tendencias de la compaa,
a veces esto resulta difcil, ya que con frecuencia los datos se mantienen en sistemas separados,
por ejemplo por departamento, como consecuencia del uso de tecnologas obsoletas.

Un almacn de datos es una base de datos que almacena la informacin actual e histrica de
inters potencial para los encargados de tomar decisiones en la compaa. Los datos se originan
en muchos sistemas (de transacciones operacionales) bsicos. El almacn de datos consolida y
estandariza la informacin de distintas bases de datos operacionales.

ste almacn pone los datos a disposicin de cualquiera que los necesite, pero no se pueden
alterar. Un sistema de almacn de datos tambin provee un rango de herramientas de consulta
estandarizadas, herramientas analticas y facilidades de informes grficos. Muchas empresas
usan portales de intranets para que la informacin del almacn de datos est disponible en toda
la empresa.
Mercados de datos

A veces las organizaciones crean un almacn de datos central que da servicio a toda la
organizacin o crean almacenes pequeos y descentralizados conocidos como mercados de
datos. Un mercado de datos es un subconjunto de un almacn de datos e incluye datos de
alto grado de enfoque y se ponen en una base de datos separada para una poblacin especfica
de usuarios.
Por ejemplo, una compaa podra desarrollar mercados de datos sobre marketing y ventas para
lidiar con la informacin de los clientes. Por lo general, un mercado de datos se enfoca en un solo
tema o lnea de negocios, por lo que es comn que se construya con ms rapidez y a un menor
costo que un almacn de datos a nivel empresarial.

HERRAMIENTAS PARA LA INTELIGENCIA DE NEGOCIOS: ANLISIS DE DATOS


MULTIDIMENSIONAL Y MINERA DE DATOS
Una vez que los datos ya estn organizados en almacenes de datos y en mercados de datos, se
pueden analizar con herramientas para la inteligencia de negocios para encontrar patrones y
relaciones tiles para la toma de decisiones. Las principales herramientas incluyen software para
consultas e informes, herramientas para anlisis multidimensional y herramientas para la
minera de datos.
Procesamiento analtico en lnea (OLAP)
Suponga que su compaa vende cuatro productos distintos. Si desea hacer una pregunta
bastante directa, como cuntas unidades de un producto se vendieron durante el trimestre
pasado se puede consultar la base de datos de ventas. Pero Qu pasara si quisiera saber
cuntas unidades de un producto se vendieron en cada una de sus regiones de ventas, para
comparar los resultados actuales con las ventas proyectadas? Para obtener la respuesta,

necesitara el Procesamiento Analtico en Lnea (OLAP). OLAP soporta el anlisis de datos


multidimensional, el cual permite a los usuarios ver los mismos datos de distintas formas
mediante el uso de varias dimensiones. Cada aspecto de informacin producto, precios, costo,
regin o periodo de tiempo representa una dimensin distinta.

Minera de datos
Las consultas en las bases de datos tradicionales responden a preguntas como: Cuntas
unidades del producto nmero 403 se enviaron en febrero de 2010? El OLAP (anlisis
multidimensional) soporta solicitudes mucho ms complejas de informacin, como: Comparar
las ventas del producto 403 relativas con el plan por trimestre y la regin de ventas durante los
ltimos dos aos. Con OLAP y el anlisis de datos orientados a consultas, los usuarios necesitan
tener una buena idea sobre la informacin que estn buscando.
La minera de datos est ms orientada al descubrimiento, ya que provee perspectivas hacia
los datos corporativos que no se pueden obtener mediante OLAP, al encontrar patrones y
relaciones ocultas en las bases de datos grandes e inferir reglas a partir de estos patrones y
relaciones, para predecir el comportamiento a futuro.
Los tipos de informacin que se pueden obtener de la minera de datos son:

Asociaciones: Ocurrencias vinculadas a un solo evento. Por ejemplo, un estudio de los


patrones de compra en supermercados podra revelar que, cuando se compran frituras de
maz, el 65 por ciento del tiempo se compra un refresco de cola, pero cuando hay una
promocin, el 85 por ciento se compra un refresco de cola.

Secuencias: Los eventos se vinculan en el transcurso del tiempo. Por ejemplo, podramos
descubrir que si se compra una casa, el 65 por ciento del tiempo se compra un nuevo
refrigerador dentro de las siguientes dos semanas, y el 45 por ciento se compra un horno
dentro del mes.

Clasificaciones: Reconoce los patrones que describen el grupo al que pertenece un


elemento, para lo cual se examinan los elementos existentes que hayan sido clasificados y
se infiere un conjunto de reglas. Por ejemplo, las empresas como las compaas de
tarjetas de crdito o las telefnicas se preocupan por la prdida de clientes estables. La
clasificacin ayuda a descubrir las caractersticas de los clientes con probabilidades de
dejar de serlo y puede proveer un modelo para ayudar a los gerentes a predecir quines
son esos clientes, de modo que puedan idear campaas especiales para retenerlos.

Agrupamientos: Funciona de una manera similar a la clasificacin cuando an no se han


definido grupos. Una herramienta de minera de datos puede descubrir distintas
agrupaciones dentro de los datos, como el hecho de encontrar grupos de afinidad para

tarjetas bancarias o particionar una base de datos en grupos de clientes con base en la
demografa.

Pronsticos: Aunque estas aplicaciones implican predicciones, el pronstico utiliza las


predicciones de una manera distinta. Se basa en una serie de valores existentes para
pronosticar cules sern los otros valores.

El anlisis predictivo utiliza las tcnicas de minera de datos, los datos histricos y las
suposiciones sobre las condiciones futuras para predecir los resultados de los eventos, como la
probabilidad de que un cliente responda a una oferta o que compre un producto especfico.
Minera de datos y minera Web
El correo electrnico, los memorndums, las transcripciones de los call centers, las respuestas a
las encuestas, los casos legales, las descripciones de patentes y los informes de servicio son
todos elementos valiosos para encontrar patrones y tendencias que ayuden a los empleados a
tomar mejores decisiones de negocios.
En la actualidad hay herramientas de minera de texto disponibles para ayudar a las empresas
a analizar estos datos. Estas herramientas pueden extraer elementos clave de los conjuntos de
datos extensos no estructurados, descubrir patrones y relaciones, as como sintetizar la
informacin. Las empresas podran recurrir a la minera de texto para analizar las transcripciones
de los call centers de servicio al cliente para identificar las principales cuestiones de servicio y
reparacin.
La Web es otra fuente extensa de informacin valiosa, y parte de sta se puede explotar en
busca de patrones, tendencias y perspectivas en relacin con el comportamiento de los clientes.
El descubrimiento y anlisis de los patrones tiles y la informacin proveniente de World Wide
Web se denominan minera Web. Las empresas podran recurrir a la minera Web para que les
ayude a comprender el comportamiento de los clientes, evaluar la efectividad de un sitio Web
especfico o cuantificar el xito de una campaa de marketing.
LAS BASES DE DATOS Y WEB
Suponga por ejemplo que un cliente con un navegador Web desea buscar informacin de precios
en la base de datos en lnea de un vendedor minorista. El usuario accede al sitio Web del
vendedor a travs de Internet mediante el software de navegador Web en su PC cliente. El
software de navegador Web del usuario solicita informacin a la base de datos de la
organizacin, mediante comandos de HTML para comunicarse con el servidor Web. Como
muchas bases de datos de procesamiento en segundo plano (back-end) no pueden interpretar
comandos escritos en HTML, el servidor Web pasa estas solicitudes de datos al software que
traduce los comandos de HTML en SQL, de modo que el DBMS que trabaja con la base de datos
pueda procesarlos. En un entorno cliente/servidor, el DBMS reside en una computadora dedicada
llamada servidor de bases de datos. El DBMS recibe las solicitudes de SQL y provee los datos
requeridos. El middleware transforma la informacin de la base de datos interna y la devuelve al
servidor Web para que la ofrezca en forma de una pgina Web al usuario.

Hay varias ventajas en cuanto al uso de Web para acceder a las bases de datos internas de una
organizacin. En primer lugar, el software de navegador Web es mucho ms fcil de usar que las
herramientas de consulta propietarias. En segundo lugar, la interfaz Web requiere pocos o
ningn cambio en la base de datos interna. Es mucho menos costoso agregar una interfaz Web
frente a un sistema heredado que redisear y reconstruir el sistema para mejorar el acceso de
los usuarios.
El acceso a las bases de datos corporativas por medio de Web est creando nuevas eficiencias,
oportunidades y modelos de negocios, Otras compaas han creado empresas totalmente
nuevas con base en el acceso a bases de datos extensas a travs de Web.

ADMINISTRACIN DE LOS RECURSOS DE DATOS


Una poltica de informacin es la que especifica las reglas de la organizacin para compartir,
diseminar, adquirir, estandarizar, clasificar e inventariar la informacin. La poltica de
informacin establece procedimientos y rendiciones de cuentas especficos, identifica qu
usuarios y unidades organizacionales pueden compartir informacin, en dnde distribuirla y
quin es responsable de actualizarla y mantenerla.
La administracin de datos es responsable de las polticas y procedimientos especficos a
travs de los cuales se pueden administrar los datos como un recurso organizacional. Estas
responsabilidades abarcan el desarrollo de la poltica de informacin, la planificacin de los
datos, la supervisin del diseo lgico de la base de datos, y el desarrollo del diccionario de
datos, as como el proceso de monitorear la forma en que los especialistas de sistemas de
informacin y los grupos de usuarios finales utilizan los datos.

ASEGURAMIENTO DE LA CALIDAD DE LOS DATOS


Los datos imprecisos, inoportunos o inconsistentes con otras fuentes de informacin conducen a
decisiones incorrectas, llamadas a revisin de los productos y prdidas financieras. Si una base
de datos est diseada en forma apropiada y hay estndares de datos establecidos a nivel
empresarial, los elementos de datos duplicados o inconsistentes deben reducirse al mnimo. Sin
embargo, la mayora de los problemas de calidad de los datos, como los nombres mal escritos,
los nmeros transpuestos y los cdigos incorrectos o faltantes, se derivan de los errores durante

la captura de los datos. La incidencia de dichos errores aumenta a medida que las compaas
pasan sus negocios a Web y permiten que los clientes y proveedores introduzcan datos en sus
sitios Web para actualizar de manera directa los sistemas internos.
Con frecuencia, el anlisis de la calidad de los datos empieza con una auditora de calidad de
los datos, la cual es una encuesta estructurada de la precisin y el nivel de su integridad en un
sistema de informacin. Las auditoras de calidad de los datos se pueden realizar mediante la
inspeccin de los archivos de datos completos, la inspeccin de muestras provenientes de los
archivos de datos, o mediante encuestas a los usuarios finales sobre sus percepciones en cuanto
a la calidad de los datos.
La limpieza de datos, conocida tambin en ingls como data scrubbing, consiste en
actividades para detectar y corregir datos en una base que sean incorrectos, incompletos, que
tengan un formato inapropiado o que sean redundantes. La limpieza de datos no slo corrige los
errores, sino que tambin impone la consistencia entre los distintos conjuntos de datos que se
originan en sistemas de informacin separados.

RESUMEN DE REPASO
1. Cules son los problemas de administrar los recursos de datos en un entorno de
archivos tradicional y cmo se resuelven mediante un sistema de administracin de
bases de datos?
Las tcnicas tradicionales de administracin de archivos dificultan a las organizaciones el
proceso de llevar el registro de todas las piezas de datos que utilizan de una manera sistemtica,
y de organizarlos de modo que se pueda tener un fcil acceso a ellos. Se permiti a las distintas
reas y grupos funcionales desarrollar sus propios archivos en forma independiente. Con el
tiempo, este entorno tradicional de administracin de archivos crea problemas como la
redundancia e inconsistencia de los datos, la dependencia programa-datos, inflexibilidad, mala
seguridad, falta de comparticin y disponibilidad de stos. Un sistema de administracin de
bases de datos (DBMS) resuelve estos problemas mediante software que permite su
centralizacin y administracin, de modo que las empresas tengan una sola fuente consistente
para todas sus necesidades de datos. El uso de un DBMS minimiza la cantidad de archivos
redundantes e inconsistentes.

2. Cules son las principales capacidades de los sistemas de administracin de bases


de datos (DBMS) y por qu es tan poderoso un DBMS?
Las principales capacidades de un DBMS son: capacidad de definicin de datos, capacidad
de diccionario de datos y lenguaje de manipulacin de datos. La capacidad de definicin
de datos especifica la estructura y el contenido de la base de datos. El diccionario de datos es un
archivo automatizado o manual que almacena informacin sobre los datos en la base, entre
estos, nombres, definiciones, formatos y descripciones de los elementos de datos. El lenguaje de
manipulacin de datos (como SQL) es un lenguaje especializado para acceder a los datos y
manipularlos en la base. La base de datos relacional es el mtodo primario para organizar y dar
mantenimiento a los datos en la actualidad en los sistemas de informacin, ya que es muy
flexible y accesible. Organiza los datos en tablas bidimensionales conocidas como relaciones con
filas y columnas. Cada tabla contiene informacin acerca de una entidad y sus atributos. Cada
fila representa un registro y cada columna representa un atributo o campo. Cada tabla contiene
tambin un campo clave para identificar en forma nica cada registro para recuperarlo o

manipularlo. Las tablas de las bases de datos relacionales se pueden combinar con facilidad para
ofrecer los datos que requieren los usuarios, siempre y cuando dos tablas cualesquiera
compartan un elemento de datos comn.
3. Cules son algunos principios importantes del diseo de bases de datos?
Para disear una base de datos se requieren un diseo lgico y uno fsico. El diseo lgico
modela la base de datos desde una perspectiva de negocios. El modelo de datos de la
organizacin debe reflejar sus procesos de negocios clave y los requerimientos para la toma de
decisiones. El proceso de crear estructuras de datos pequeas, estables, flexibles y adaptativas a
partir de grupos complejos de datos al momento de disear una base de datos relacional se
denomina normalizacin. Una base de datos relacional bien diseada no debe tener relaciones
de varios a varios, y todos los atributos para una entidad especfica slo se aplican a esa
entidad. Esta base de datos trata de imponer las reglas de integridad referencial para asegurar
que las relaciones entre tablas acopladas permanezcan consistentes. Un diagrama entidadrelacin describe en forma grfica la relacin entre las entidades (tablas) en una base de datos
relacional.

4. Cules son las principales herramientas y tecnologas para acceder a la


informacin de las bases de datos y mejorar tanto el desempeo de negocios como la
toma de decisiones?
Hay poderosas herramientas disponibles para analizar y acceder a la informacin en las bases de
datos. Un almacn de datos consolida los datos actuales e histricos de muchos sistemas
operacionales distintos en una base central diseada para generar informes y realizar anlisis.
Los almacenes de datos soportan el anlisis de datos multidimensional, tambin conocido como
procesamiento analtico en lnea (OLAP). El OLAP representa las relaciones entre los datos como
una estructura multidimensional, que se puede visualizar en forma de cubos de datos y cubos
dentro de cubos de datos, con lo cual se permite un anlisis ms sofisticado.
La minera de datos analiza grandes reservas de datos, incluyendo el contenido de los
almacenes de datos, para encontrar patrones y reglas que se puedan utilizar para predecir el
comportamiento en un futuro y guiar la toma de decisiones. Las herramientas de minera de
datos ayudan a las empresas a analizar extensos conjuntos de datos no estructurados que
consisten en texto. Las herramientas de minera de datos se enfocan en el anlisis de patrones e
informacin tiles provenientes de World Wide Web; examinan la estructura de los sitios Web y
las actividades de los usuarios de esos sitios Web, as como el contenido de las pginas Web.

También podría gustarte