Fundamentos de inteligencia de negocios: bases de datos y administración de la información
Organización de los datos en un entorno de archivos tradicional
Un sistema de información efectivo provee a los usuarios información precisa, oportuna y relevante. La información precisa está libre de errores. La información es oportuna cuando está disponible para los encargados de tomar decisiones en el momento en que la necesitan. Así mismo, es relevante cuando es útil y apropiada tanto para los tipos de trabajos como para las decisiones que la requieren
TERMINOS Y CONCEPTOS DE ORGANIZACIÓN DE ARCHIVOS
Un sistema computacional organiza los datos en una jerarquía que empieza con bits y bytes, y progresa hasta llegar a los campos, registros, archivos y bases de datos.Un grupo de bits, denominado byte, representa a un solo carácter, que puede ser una letra, un número u otro símbolo. Un agrupamiento de caracteres en una palabra, un conjunto de palabras o un número completo (como el nombre o la edad de una persona) se denomina campo. Un grupo de campos relacionados, como el nombre del estudiante, el curso que va a tomar, la fecha y la calificación, representan un Registro; un grupo de registros del mismo tipo se denomina archivo. Un grupo de archivos relacionados constituye una base de datos. Un registro describe a una entidad. Una entidad es una persona, lugar, cosa o evento sobre el cual almacenamos y mantenemos información. Cada característica o cualidad que describe a una entidad específica se denomina atributo.
PROBLEMAS CON EL ENTORNO DE ARCHIVOS TRADICIONAL
En la mayoría de las organizaciones, los sistemas tendían a crecer de manera independiente sin un plan a nivel de toda la compañía. Contabilidad, finanzas, manufactura, recursos humanos, ventas y marketing han desarrollado sus propios sistemas y archivos de datos.Los problemas resultantes son:
1) La redundancia e inconsistencia de los datos: es la presencia de datos duplicados en varios archivos, de modo que se almacenen los mismos datos en más de un lugar o ubicación. Desperdicia recursos de almacenamiento y también conduce a la inconsistencia de los datos, en donde el mismo atributo puede tener distintos valores
2) La dependencia programa-datos: se refiere al acoplamiento de los datos almacenados en archivos y los programas específicos requeridos para actualizar y dar mantenimiento a esos archivos, de tal forma que los cambios en los programas requieran cambios en los datos.
3) La inflexibilidad: Un sistema de archivos tradicional puede entregar informes programados de rutina después de cierto esfuerzo extenso de programación, pero no puede entregar informes ad hoc ni responder de manera oportuna a los requerimientos de información no anticipados.
4) La seguridad defectuosa de los datos: Como hay poco control o poca administración de los datos, el acceso a la información, así como su diseminación, pueden estar fuera de control. La gerencia tal vez no tenga forma de saber quién está accediendo a los datos de la organización, o incluso modificándolos.
5) La incapacidad de compartir datos entre aplicaciones: La información no puede fluir con libertad entre áreas funcionales o partes de la organización distintas. Si los usuarios encuentran valores desiguales de la misma pieza de información en dos sistemas diferentes, tal vez no quieran usar estos sistemas debido a que no pueden confiar en la precisión de sus datos.
La metodología de las bases de datos para la administración de datos
Una definición más rigurosa de una base de datos es la de una colección de datos organizados para dar servicio a muchas aplicaciones de manera eficiente, al centralizar los datos y controlar los que son redundantes. En vez de guardar los datos en archivos separados para cada aplicación, se almacenan de modo que los usuarios crean que están en una sola ubicación.
Sistemas de administración de bases de datos
Un Sistema de Administración de Bases de Datos (DBMS) es software que permite a una organización centralizar los datos, administrarlos en forma eficiente y proveer acceso a los datos almacenados mediante programas de aplicación. El software de administración de bases de datos se encarga de que la base de datos física esté disponible para las diferentes vistas lógicas requeridas por los usuarios.
Como resuelve un DBMS los problemas del entorno de archivos tradicionales
Un DBMS reduce la redundancia e inconsistencia de los datos al minimizar los archivos aislados en los que se repiten los mismos datos. El DBMS permite a la organización administrar los datos, su uso y su seguridad en forma central.
DBMS relacional
Las bases de datos relacionales representan los datos como tablas bidimensionales (llamadas relaciones), a las cuales se puede hacer referenciacomo si fueran archivos. Cada tabla contiene datos sobre una entidad y sus atributos.Microsoft Access es un DBMS relacional para sistemas de escritorio, por ejemplo.

Operaciones de un DBMS relacional
En una base de datos relacional se utilizan tres operaciones básicas, como se muestra en la figura 6-5, para desarrollar conjuntos útiles de datos:
1. Seleccionar: crea un subconjunto que consiste en todos los registros del archivo que cumplan con criterios establecidos. En otras palabras, la selección crea un subconjunto de filas que cumplen con ciertos criterios
2. Unir: combina tablas relacionales para proveer al usuario más información de la que está disponible en las itablas individuales
3. Proyectar: crea un subconjunto que consiste de columnas en una tabla, con lo cual el usuario puede crear nuevas tablas que contengan sólo la información requerida.
DBMS orientado a objetos
Un DBMS orientado a objetos almacena los datos y los procedimientos que actúan sobre esos datos como objetos que se pueden recuperar y compartir de manera automática.Ahora hay sistemas DBMS objeto-relacional híbridos, que ofrecen las capacidades de los sistemas DBMS tanto orientados a objetos como relacionales.

Bases de datos en la nube
¿Hay alguna forma de administrar los datos en la nube? La respuesta es un «sí» condicional. Los proveedores de computación en la nube ofrecen servicios de administración de bases de datos, pero por lo general estos servicios tienen menos funcionalidad que sus contrapartes dentro de las premisas de la empresa.

