jueves, 21 de julio de 2011

1.25 Inteligencia de Negocio Aplicada al Pronóstico de Venta en Franquicias de Café (continuación).

DCC. Dafne Rosso Pelayo
La inteligencia de negocio en la empresa, sólo puede lograrse mediante la adopción de medidas para alcanzarla.

En el artículo  anterior comenzamos nuestro análisis predictivo para realizar el pronóstico de venta en franquicias de café. En este artículo concluiremos este ejercicio.  
Retomando algunos puntos del artículo anterior:
Objetivo del pronóstico
Estimar el pronóstico de venta diaria del siguiente trimestre de los productos de mayor venta para las Franquicias de café. 
Como resultado de contar con el pronóstico de venta, la franquicia además, podrá estimar con mayor exactitud los flujos de efectivo así como también realizar una mejor distribución de la materia prima por local.
Variables empleadas
Los datos proporcionados por la franquicia son los volúmenes diarios de venta por producto de enero a diciembre de 2000 y el primer trimestre de 2001. La variable incluida para el análisis que tiene una afectación directa con la venta es la temperatura, mientras más baja sea la temperatura más se vende. Otra de las variables que también tiene una inferencia sobre la venta es la lluvia, la cual mediremos con la precipitación pluvial. Los datos de la temperatura y de la precipitación fueron obtenidos del servicio meteorológico nacional
Resultados preliminares del análisis avanzado de minería de datos
Después de aplicar el análisis de minería comparamos los resultados obtenidos en la predicción de un trimestre ya conocido, con los datos que se nos proporcionaron.  La tasa de error que encontramos fue de más del 30%, la gran variación de los datos se  desprende de que en periodos vacacionales la venta está suspendida, la venta decrece ciertos días de la semana,  la venta aumenta los fines de semana y aumenta en algún evento de temporada (Ej. días festivos -10 de mayo: día de las madres en México -)  así como en temporada de exámenes.
Este tipo de comportamiento obliga a que se agreguen variables que permitan clasificar mejor el comportamiento de los datos y que faciliten la predicción de los mismos. Recordemos la premisa tres del artículo anterior.
Premisa tres
Para una mejor clasificación de los datos es probable que tenga que agregar variables que mejoren las clasificaciones o expliquen el comportamiento.
Por lo tanto, después de realizar los análisis en la  información, se propone una clasificación para cada comportamiento encontrado.

Estas clasificaciones puede usted determinarlas de acuerdo  al comportamiento particular de  la venta de su negocio, se trate de café o de cualquier otra cosa, realizando la asociación a eventos o factores, por ejemplo: la venta se cancela por periodos vacacionales o días festivos, baja considerablemente en los puentes, baja los sábados que sólo atiende medio día, etc.
El análisis que se llevo a cabo, comprendió además, buscar que tan relacionadas estaban las variables, buscando el coeficiente de correlación entre los grupos de datos.
Se encontró que la variable temperatura, al igual que la precipitación pluvial, se relaciona con la variable venta de cada uno de los productos. La siguiente tabla tiene un ejemplo de los datos empleados.


Fecha
Día
Precipitación pluvial
Temperatura
Capuchino Med
Capuchino  Grand
Americano med.
29/03/01
Jueves
0.64
9.2
0
0
0
30/03/01
Viernes
0.61
9.2
0
0
0
31/03/01
Sábado
0.68
9.2
0
0
0
06/05/00
Sábado
0.923
10.8
5
1
1
02/09/00
Sábado
0.139
11.5
6
1
1
21/10/00
Sábado
0.96
9.8
8
1
2
02/12/00
Sábado
0.817
6.6
6
1
2
09/12/00
Sábado
0.654
6.6
4
1
2
15/12/00
Viernes
0.65
6.6
12
1
4
20/05/00
Sábado
0.935
10.8
26
2
8
07/10/00
Sábado
0.963
9.8
16
2
3
28/10/00
Sábado
0.997
9.8
7
2
4
11/11/00
Sábado
0.708
7.9
3
2
3
08/04/00
Sábado
1.1
9.2
15
3
10
13/05/00
Sábado
0.964
10.8
20
3
7
17/06/00
Sábado
0.988
11.7
17
3
6
30/07/00
Domingo
0.992
11.5
32
3
13
09/09/00
Sábado
0.076
11.5
11
3
3
23/09/00
Sábado
0.116
11.5
9
3
3
14/10/00
Sábado
0.986
9.8
8
3
2
20/03/00
Lunes
0.77
9.2
0
4
5
01/04/00
Sábado
0.97
9.2
18
4
4
05/04/00
Miércoles
1.02
9.2
53
4
21
06/04/00
Jueves
0.77
9.2
34
4
11
12/05/00
Viernes
0.978
10.8
51
4
21
02/06/00
Viernes
0.951
11.7
22
4
12
02/08/00
Miércoles
0.996
11.6
28
4
11
15/09/00
Viernes
0.042
11.5
15
4
7
30/09/00
Sábado
0.032
11.5
17
4
3
13/10/00
Viernes
0.949
9.8
13
4
5
14/11/00
Martes
0.701
7.9
35
4
14
25/11/00
Sábado
0.876
7.9
15
4
4


Con los datos (completos) que analizamos se ve claramente que tenemos una correlación negativa entre las variables, es decir a medida que una aumenta la otra disminuye y viceversa, como se muestra en la siguiente gráfica. Cuando la temperatura baja la venta aumenta y cuando la venta baja la temperatura aumenta.
Este tipo de inferencias resultan muy provechosas, le proporcionan más elementos para obtener un mejor y más exacto análisis predictivo, que el que obtendría basándose sólo en la historia. Deje darle un ejemplo:  Suponga que en febrero su venta promedio de café para 4 años fue de 250 unidades, pero los últimos años no se mantuvo así, descendió, y el promedio de enero aumento. ¿Por qué? Porque los últimos años la temperatura ha descendido varios grados en enero y ha aumentado considerablemente en febrero acortando el invierno (en la Cd. de México). La temperatura y la humedad, afectan el gusto de los clientes y por lo tanto su consumo de café. Por supuesto que muchos otros factores pueden afectar la venta, pero en este caso estoy hablando sólo de las variables temperatura y humedad.
Al adicionar una nueva variable para llevar en la clasificación se observa desde los primeros minutos de análisis de la red una importante diminución de los porcentajes de error promedio obtenidos en el proceso de aprendizaje para los datos de prueba.
La nueva variable adicionada la denominamos PERIODO

PERIODO
SIGNIFICADO
0
No venta, sitio cerrado
1
Día festivo
2
Día de evento
3
Vacaciones escolares

En el segundo análisis después de la inclusión de la clasificación del periodo, se obtuvo una disminución del error máximo, aunque este sigue siendo demasiado alto
Analizando nuevamente los resultados se ve que existe otra clasificación más que son los fines de semana, sábados en donde la venta es mucha, domingos que es nula, y días normales
Con esta nueva clasificación se logra agrupar a los datos de acuerdo a un comportamiento según el  volumen de ventas diario.
La nueva variable adicionada se denomina FinesDeSemana

FinesDeSemana
SIGNIFICADO
1
Sábados venta medio día
2
Día normal

El nuevo conjunto de datos se observa así (extracto):

Fecha
Dia
Periodo
Findesemana
Precipitación pluvial
Temperatura
Cap.Med
Cap.Grand
Americano med.
08/01/2010
Lunes
1.00
2.00
9.5
12.2
27
13
17
09/01/2010
Viernes
1.00
2.00
8.4
11.8
27
17
14
10/01/2010
Miércoles
1.00
2.00
8.2
12.1
27
7
8
11/01/2010
Miércoles
1.00
2.00
9.6
11.6
28
4
11
12/01/2010
Viernes
1.00
2.00
8.5
12
28
8
13
13/01/2010
Viernes
1.00
2.00
9.5
12.1
28
8
6
14/01/2010
Sábado
1.00
1.00
8.2
12
29
6
13
15/01/2010
Martes
1.00
2.00
8.7
11.8
29
4
7
16/01/2010
Viernes
1.00
2.00
9.5
12
29
10
5
17/01/2010
Viernes
1.00
2.00
8.4
11.8
29
6
9
18/01/2010
Viernes
1.00
2.00
9.6
11.5
30
7
11
19/01/2010
Lunes
1.00
2.00
8.6
11.6
30
12
12
20/01/2010
Lunes
1.00
2.00
8.5
11.9
30
9
10
21/01/2010
Jueves
1.00
2.00
8.4
11.8
30
4
17
22/01/2010
Viernes
1.00
2.00
8.2
11.6
30
5
14
23/01/2010
Viernes
1.00
2.00
8.5
11.6
31
8
10
24/01/2010
Miércoles
1.00
2.00
8.7
11.7
31
7
11
25/01/2010
Viernes
1.00
2.00
9.5
11.6
31
10
20
26/01/2010
Sábado
1.00
1.00
9.5
11.6
32
6
14
27/01/2010
Viernes
1.00
2.00
9.8
11.6
32
5
18
28/01/2010
Miércoles
1.00
2.00
9.6
11.8
32
10
13
29/01/2010
Sábado
1.00
1.00
9.5
11.5
32
3
13
30/01/2010
Jueves
1.00
2.00
9.6
11.6
32
10
12


De acuerdo con los datos obtenidos de la muestra se comprobó que mientras mejor clasificados se encuentren los datos, los resultados que presenta el análisis son más aproximados a la realidad.
Dado este comportamiento de aprendizaje y clasificación de datos, se puede concluir que realizando nuevas agrupaciones de los datos será posible lograr una mayor convergencia en la red.
Las nuevas clasificaciones que se sugieren son: la toma de la venta por horario de venta en turnos matutino, vespertino y nocturno, la toma de la temperatura promedio del día de la zona en donde se encuentre ubicado el sitio de venta, en lugar de tomar la temperatura promedio de toda la zona metropolitana que fue el dato que usamos para nuestro análisis.
Con esto logramos un error de menos de un 10%, lo cual permite planear mucho mejor las inversiones en materiales y satisfacer las necesidades de venta.
El uso del simulador permitió observar diferentes patrones de comportamiento y fue mucho más sencillo efectuar la predicción de la venta incorporando las nuevas variables, que haber realizado un análisis estadístico con una regresión múltiple para cada caso y haberla repetido cada vez que se encontraba una nueva clasificación.

Copyright © 2011 Dafne Rosso Pelayo. Todos los derechos reservados.
 Fig 1. Relación venta VS temperatura