jueves, 9 de mayo de 2013


Esta última parte del blog la voy a tratar sobre BUSINESS INTELLIGENCE.

Definiciones y Funciones

Business Intelligence (BI) o La Inteligencia de Negocios, la podemos definir como la habilidad de consolidar información y analizarla con la suficiente velocidad y precisión para descubrir ventajas y tomar mejores decisiones de negocios.

BI trata de una “suite” de productos de manera conjunta para proveer datos, información y reportes analíticos que satisfagan las necesidades de una gran variedad de usuarios finales.
Consiste en acceder y analizar tipos cuantitativos de información y ser capaz de actuar en consecuencia al conjunto.

Se dice que el conjunto de tecnologías que usan Data Warehousing y OLAP (Online Analitic Procesing (procesamiento analítico en línea)), combinado con herramientas de reporte, son referidas como Business Intelligence ya que ayudan a las compañías a ganar inteligencia en operaciones y desempeño y a analizarlas.

BI apoya a los tomadores de decisiones con la información correcta, en el momento y lugar correcto, lo que les permite ser más decisivos en las tomas de decisiones para sus negocios. Utiliza herramientas y técnicas ETL (Extraer, Transformar y Cargar) los datos.

Las Áreas más comunes en las que se usan las soluciones de BI

-         Análisis de ventas
-         Detección de clientes importantes
-         Análisis de productos, líneas y mercados
-         Marketing: Segmentación y análisis de clientes
-         Razones Financieras
-         Logística: Seguimiento de embarques
-         Análisis de desperdicios
-         Rotación de inventario

Características

·    Accesibilidad a la información: se garantiza el acceso de los usuarios a los datos de manera independiente.
·   Apoyo en la toma de decisiones: busca la manera en que los usuarios tengan acceso a herramientas de análisis.
·     Orientación a los usos finales: se busca independencia entre los conocimientos técnicos de los usuarios.
·        Es crítico para:
-         Obtener la información del negocio de manera oportuna y precisa.
-         Predecir resultados.
-         Ejecutar y monitorear planes operativos.
-         Analizar condiciones de mercado y el ambiente de competencia.
-         Identificar amenazas

Niveles de Realización

·        Consultas e informes simples: son herramientas para la elaboración de informes y listados.
·        Cubos OLAP: son bases de datos orientadas al procesamiento analítico.
·        Data Mining o minería de datos: es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos.
·        Sistemas de previsión empresarial: son predicciones mediante estudios de series temporales.

Elementos

  • Data Warehousing y Data Marts: son sistemas de almacenamiento de datos.
  • Data Mining: son herramientas para minería de datos.
  • OLAP: son herramientas de procesamiento analítico de datos.
  • ELT: son herramientas de extracción, traducción y carga de datos.
  • Portales de información empresarial.
  • Sistemas de base de datos.
  • Sistemas de administración del conocimiento.

Ventajas

1)      Permite disponer de una herramienta de información sobre la gestión del negocio.
2)      Facilita información que permite priorizar actividades basadas en la necesidad de cumplimiento de objetivos de corto, mediano y largo plazo.
3)      Proporciona una única versión de la realidad del negocio.
4)      El usuario es capaz de construir sus propios reportes e índices de desempeño.
5)      Permite crear escenarios con respecto a una decisión y hacer pronósticos de ventas y devoluciones.
6)      Disminuye el tiempo de recogida de información por lo que aumenta el tiempo disponible para el análisis.

Software

Por último explicare los componentes de los que está formado el Business Intelligence:

  • Multidimensional: la información multidimensional se puede encontrar en hojas de cálculo.
  • Data Mining: las empresas suelen generar grandes cantidades de información sobre sus procesos productivos, desempeño operacional, mercados y clientes.
  • Agentes: los agentes son programas que “piensas”. Ellos pueden realizar tareas a un nivel muy básico sin necesidad de intervención humana.
  • Data Warehouse: es la respuesta de la tecnología de información a la descentralización en la toma de decisiones.
                                                                  Cristian Knelleken Barroso 09/05/2013

sábado, 4 de mayo de 2013


¿Cómo se define la recuperación de la información?
Proceso donde se accede a una información previamente almacenada, mediante herramientas informáticas que permiten establecer ecuaciones de búsqueda específicas. Dicha información ha debido de ser estructura previamente a su almacenamiento.


Características
El proceso de recuperación se lleva a cabo mediante consultas a la base de datos donde se almacena la información estructurada, mediante un lenguaje de adecuado. Es necesario tener en cuenta los elementos clave que permiten hacer la búsqueda, determinando, como los índices, palabras clave, y los fenómenos que se pueden dar en el proceso como son el ruido y silencio documental, que explicaré a continuación. Uno de los problemas que surgen en la búsqueda de información es si lo que recuperamos es "mucho o poco".

Silencio documental: Son aquellos documentos almacenados en la base de datos pero que no han sido recuperados, debido a que la estrategia de búsqueda ha sido demasiado específica o que las palabras clave utilizadas no son las adecuadas para definir la búsqueda.

Ruido documental: Son aquellos documentos recuperados por el sistema pero que no son relevantes. Esto suele ocurrir cuando la estrategia de búsqueda se ha definido demasiado genérica.

Técnicas de recuperación de información

Sistemas de recuperación de lógica difusa
Esta técnica permite establecer consultas con frases normales, de forma que la máquina al realizar la búsqueda elimina signos de puntuación, artículos, conjunciones, plurales, tiempos verbales, palabras comunes, dejando sólo aquellas palabras que el sistema considera relevantes. La recuperación se basa en proposiciones lógicas con valores de verdadero y falso.

Técnicas de ponderación de términos
Pretende darle un valor adecuado a la búsqueda dependiendo de los intereses del usuario. Los documentos recuperados se encuentran en función del valor obtenido en la ponderación. El valor depende de los términos pertinentes que contengan el documento y la frecuencia con que se repita.

Técnica de clustering
Es un modelo que permite las ver las frecuencias de los términos de búsqueda en los documentos recuperados. Se atribuyen unos valores que actúan como agentes para agrupar los documentos por orden de importancia, mediante algoritmos ranking.

Técnicas de retroalimentación por relevancia
Esta técnica pretende obtener el mayor número de documentos relevantes tras establecer varias estrategias de búsqueda. La idea es que, tras determinar unos criterios de búsqueda y observar los documentos recuperados, se vuelva a repetir nuevamente la consulta pero esta vez con los elementos interesantes, seleccionados de los documentos primeramente recuperados.

Técnicas de stemming
La técnica de Stemming lo que pretende es eliminar las posibles confusiones semánticas que se puedan dar en la búsqueda de un concepto, para ello busca solo por la raíz, evitando ambigüedades léxicas y semánticas.

Calidad de la recuperación
A continuación voy a presentar unos criterios básicos para que la recuperación llevada a cabo sea de calidad:

Consistencia: Capacidad que tiene un sistema de búsqueda en coordinar su sistema de clasificación con el lenguaje de búsqueda, permitiendo de esta manera establecer “ecuaciones” de búsqueda sobre términos admitidos.

Exhaustividad: Es la cualidad de un sistema de información para recuperar la totalidad de los documentos relevantes que posee una colección.

Pertinencia: Es la cualidad que tiene el documento recuperado de adaptarse a las necesidades de información.

Relevancia: Característica de un documento recuperado que cumple con la necesidades de información.

Precisión: Son aquellos documentos relevantes recuperados.

Tasa de acierto: coeficiente que surge de dividir el número de documentos relevantes recuperados, sobre el número total de documentos relevantes de la colección.

Tasa de relevancia: coeficiente que surge de dividir el número de documentos relevantes recuperados, sobre el número total de documentos recuperados.

Tasa de pertinencia: coeficiente que surge de dividir el número de documentos pertinentes recuperados, sobre el número total de documentos recuperados.

Tasa de precisión: coeficiente que surge de dividir el número de documentos relevantes recuperados, sobre el número total de documentos de la colección.

                                                                   Cristian Knelleken Barroso 04/05/2013