lunes, 31 de enero de 2011

1.5 Minería de Datos Aplicada, para la Pequeña y Mediana Empresa



DCC. Dafne Rosso Pelayo

La inteligencia de negocio en la empresa, sólo puede lograrse mediante la adopción de medidas para alcanzarla.

Como comentamos al inicio de este blog, es necesario un cambio de paradigma que nos permita llevar los beneficios que ofrecen las técnicas avanzadas de computación inteligente,  como  data mining  (minería de datos), text mining (minerías de texto), ontologías, técnicas de optimización y aprendizaje dirigido a las PYMES.
En este blog iremos proporcionando paso a paso, las herramientas y técnicas que usted necesita para construir soluciones de inteligencia que pueda aplicar en su negocio, sin necesidad de invertir grandes sumas de dinero.
Hemos estado trabajando en los últimos artículos en obtener patrones de comportamiento que indiquen una dependencia entre los datos que se analizan. Dependencias que muestran que si sucede un evento A lo acompaña un evento B, estas dependencias las obtuvimos mediante la generación de un conjunto de reglas de asociación.
Por ejemplo en el caso (art 1.3) en el cual estábamos buscando estrategias de venta ¿Es suficiente para la empresa saber que  los artículos del tipo 1 los prefieren en piel y los consumen en su mayoría hombres?, estos resultados pueden ayudar a planificar inventarios, mejorar las estrategias de compra y venta de productos, pero probablemente sea necesario incrementar el tipo de datos involucrados para poder obtener resultados en otras áreas, como pueden ser: finanzas, recursos humanos, relaciones con el cliente, etc.
Conforme aumentan los datos en número y en tipo, la complejidad del análisis aumenta, por lo tanto es indispensable ubicar el conjunto de datos que se encuentre involucrado con las metas y objetivos de negocio que usted quiere alcanzar.
Supongamos el siguiente conjunto de datos que es procedente de una tienda de juguetes. El Nombre del atribuido se encuentra en las cajas azules y los diferentes valores que puede obtener en las cajas blancas.

El dueño de una juguetería o distribuidor de juguetes seguramente podrá complementar este cuadro con muchas más características propias de los juguetes. Un tipo de análisis como el del ejemplo anterior arroja elementos que nos apoyan a tomar decisiones basadas en las características propias de los juguetes más vendidos, esto permite, mejorar nuestras ventas. El siguiente paso  ahora es incorporar otros tipos de variables a este análisis.
Supongamos que a este conjunto previo de datos añadimos el siguiente conjunto

Este nuevo conjunto de datos, bajo el mismo algoritmo de reglas de asociación arroja resultados mucho más interesantes que los obtenidos en nuestro primer ejemplo. El “tipo de pago” permitirá tomar decisiones sobre el tipo de venta o descuentos que se debe aplicar a los productos, las fechas darán origen a temporadas de promociones “planificadas”, los horarios permitirán ver si conviene abrir sólo por la tarde o extender los horarios nocturnos una o dos horas, etc.
Sin embargo, el conjunto de datos conforme crece en atributos: tipo, edad, rango de precios, tipo de crédito, etc., y en número de registros, se hace un tanto complicado manejarlo como lo hicimos en el ejemplo del art 1.3, por lo tanto, se vuelve entonces necesario manejar una herramienta que nos facilite el cálculo. Conociendo el algoritmo usted o algún miembro del equipo de TI podría implementarlo en algún lenguaje de programación, o bien si manejan una hoja de cálculo, podrían controlarlo con macros y tablas pivote, sin embargo existen en el mercado, herramientas libres que nos pueden proporcionar el resultado del análisis en segundos. Los reportes bonitos los podrá hacer después a mano en la herramienta que usted prefiera y conozca, lo primordial es tener los resultados del análisis. A mi criterio no es necesario para una PYME comprar una herramienta muy costosa de minería de datos si lo único que estamos buscando es un análisis de reglas de asociación y no los otros 100 tipos de análisis que las herramientas  más robustas poseen.
En mi opinión, las mayoría de las herramientas de minería de datos están ampliamente sobradas para el tipo de análisis y analíticos avanzados que requiere una PYME. Por eso es MUY importante ir conociendo paso a paso que tipo de análisis realmente necesita su empresa y como lo puede conseguir.
La herramienta que a continuación vamos a usar se llama WEKA. WEKA es un software de minería de datos desarrollado por la Universidad de Waikato. WEKA contiene una amplia colección de algoritmos de aprendizaje para emplearse en análisis de minería de datos, y contiene dentro de otros, una buena gama de algoritmos de asociación.
Basta una búsqueda en la WEB para ubicar la página de la Universidad de Waikato y descargar WEKA, una vez instalado el software, el siguiente paso será proporcionar el archivo que contiene los datos a analizar. Le doy un ejemplo con la siguiente tabla.

Tabla 1. Ejemplo de un conjunto tabular de datos

En el siguiente articulo realizaremos el análisis con WEKA por lo que es recomendable realice su instalación y consiga los datos en forma tabular (columnas y registros) que vamos a analizar.

 
Copyright © 2011 Dafne Rosso Pelayo. Todos los derechos reservados.





2 comentarios:

Roberto Perez dijo...

La liga es: www.cs.waikato.ac.nz/ml/weka/

Saludos

Rosso Pelayo Dafne, PhD dijo...

Muchas gracias