viernes, 11 de febrero de 2011

1.7 Pasos previos a un análisis de minería de datos.

DCC. Dafne Rosso Pelayo
La inteligencia de negocio en la empresa, sólo puede lograrse mediante la adopción de medidas para alcanzarla.


En artículos anteriores hemos presentado un par de ejemplos que permiten encontrar asociaciones entre los atributos del conjunto de datos, asociaciones del tipo “A -> B” que significa que cuando ocurre el evento A entonces ocurre el evento B (ej. articulo tipo 1 -> piel: El articulo tipo 1 se vende en piel).
Este tipo de análisis asociativo permite generar estrategias de venta e incluso ver que es lo que se está vendiendo más. Sin embargo existen muchos otros tipos de análisis y es necesario darse cuenta de cuál es el más conveniente para la empresa y para los datos que posee la empresa.
Factores de Éxito
En este punto podemos encontrarnos con dos factores de éxito primordiales en las soluciones de inteligencia de negocio y estos son:
·         La preparación de los datos
·         Objetivo del análisis o de la solución de inteligencia de negocios
Hasta este momento hemos tratado temas referentes a minería de datos, en este punto es necesario hacer un alto y plantear una diferencia importantísima entre los que es la minería de datos y un sistema de descubrimiento de conocimiento en las bases de datos. Un sistema de descubrimiento de conocimiento en las bases de datos incluye la preparación de los  datos, la extracción de patrones de los datos (minería de datos) y la preparación de los modelos predictivos y/o de aprendizaje, mientras que la minería de datos se refiere sólo a la extracción de patrones en los datos.
 
Figura 1. Sistema de descubrimiento de conocimiento en las bases de datos

Ya que el lector se encuentra familiarizado con lo que es un análisis de minería de datos, ampliaremos un poco nuestro alcance y trataremos en este artículo el tema de uno de los factores de éxito más importantes en este tipo de análisis avanzado: la preparación de los datos. Es sumamente importante cuidar la validez del conjunto de datos y tener una idea clara de lo que quiere obtener, de otra manera, ¿cómo va a reconocer que ya encontró lo que estaba buscando en los datos?, si no sabe que es lo que está buscando.

Preparación de los datos
De acuerdo a los temas que intenta analizar usted deberá buscar la información adecuada, presupuesto, ventas, productos, clientes, proveedores, competencia, distribución, finanzas, o bien una mezcla de ellos.
En la mayoría de los casos esta información no se encuentra en un solo lugar, por lo que deberá ubicarla y concentrarla para proceder a la preparación de los datos. Los grandes corporativos, empresas de gobierno, empresas globales e incluso algunas PYMES medianas, ya cuentan con su información almacenada en grandes bases de datos, su trabajo consiste de igual forma en ubicar la información a procesar y crear los repositorios con la información deseada o bien los artefactos que permitan su extracción para procesarla.
En nuestro caso y punto central, si usted es una Pyme es posible que cuente con acceso a una base de datos como SQL Server, Access o MySQL, es más que suficiente, o si no basta con que concentre los datos en Excel en forma tabular.
Este paso es indispensable para generar una solución de inteligencia de negocios que involucre un análisis en los datos. Muchas empresas sub-utilizan las suites de inteligencia de negocios construyendo soluciones que son simples reporteadores de su situación pasada, en estos casos es muy factible que este paso no lo hayan realizado.
Una vez que tenga concentrada su información procedemos a la preparación de los datos la cuál consta de: validación, transformación  y selección.

Figura 2. Preparación de los datos

Validación de los datos.
Este paso se trata de un paso de limpieza y validación de la calidad de los datos, debe de determinar qué hacer en caso de que encuentre instancias que no posean un atributo, o éste se encuentre en blanco o bien que tengan ruido (datos que no se entienden, datos mal puestos). Eliminar los registros duplicados si es que existen.
Transformación de los datos.
En este paso es necesario estandarizar u homogenizar sus datos, por ejemplo si finanzas le llama a un mismo producto o región de una manera y ventas le llama de otra manera, deberá crear un estándar o metadato que ayude a la identificación de los datos de un mismo tipo.
En este paso también se extraen las características de los datos que se requieren para el análisis. Sí el tipo de análisis a efectuar requiere de datos exclusivamente numéricos, será necesario trasformar o asociar un número al dato nominal (textos) para permitir el análisis (ej. para el atributo tipo -> piel se trasforma a tipo -> 1, donde 1 significa piel).
Selección de los datos.
Una vez trasformados los datos, es necesario identificar cuál es el atributo principal o más importante en ellos, este será el principal componente del análisis. Además es necesario identificar y seleccionar  a los atributos que lo caractericen y que tengan una relación con él.

Estos pasos le pueden ayudar a crear políticas y estándares de calidad en sus datos así como mecanismos de control.
Una vez preparados los datos debemos como siguiente paso verificar cuál es el tipo de análisis que debemos efectuar en ellos.
Como se ha ido dando cuenta en este blog vamos paso a paso explicando cómo se efectúa  la construcción de sistemas de inteligencia de negocio, poniendo al alcance de las Pymes las técnicas involucradas sin recurrir a grandes inversiones.
En el siguiente artículo hablaremos del segundo factor de éxito en el desarrollo de soluciones de inteligencia de negocio, donde presentaremos los tipos de análisis que pueden ser aplicados a sus datos y qué tipo de resultados ofrecen.

No hay comentarios: