jueves, 18 de noviembre de 2010

Regresión Lineal

Aplicación de la estadística a una empresa




La factura mensual del gasto telefónico de una pequeña empresa se ha incrementado notablemente en los últimos meses. Los estudios realizados por el administrador de la misma, argumentan que el mayor uso de Internet dentro de la misma es la principal causa del mayor gasto en el teléfono, lo que ha hecho que se estudie la posibilidad de tomar alguno de los múltiples bonos o tarifas especiales que ofrecen las compañías, lo que hasta la fecha todavía no se llevó a cabo. Las últimas cifras mensuales no hacen sino confirmar esta relación:



Sea X el tiempo de conexión (minutos) y Y la cuantía de la factura telefónica (euros):








En la gráfica se muestra el diagrama de dispersión y la recta de regresión lineal:




Sea Sxy el error estándar.
Fórmula aplicada: raìz cuadrada de la suma de Y al cuadrado menos A por la suma de Y menos B por la suma de XY / tamaño de la muestra menos 2.
Para Sb. 
Fórmula aplicada: la raìz cuadrada de la suma de X al cuadrado menos el tamaño de la muestra por la media de x al cuadrado.
Para Sb1.
Fórmula aplicada: Sxy/Sb.
Para realizar la prueba T:
Sea ((b) / Sb1).




El resultado de la prueba T fue de 9.85088517, el cual indica que cae fuera de la región de aceptación, es decir, cae fuera del rango de (-2.353 -  2.353), por lo tanto rechaza la hipótesis nula la cual es igual a cero. Y acepta la hipótesis alternativa, y ésta explica que en la población existe una regresión lineal al igual que la muestra.

Sea SSR la suma total de regresión
Fórmula aplicada: a por la suma total de Y más b por la suma total de XY menos el número total de muestra por la media de Y al cuadrado.
Sea SST la suma total de cuadrados
Fórmula aplicada: suma total de Y al cuadrado menos el número total de muestra por la media de Y al cuadrado.
Para el coeficiente de determinación (r)
Fórmula aplicada: raiz cuadrada de SSR/SST.




De acuerdo con la información anterior, responda a las siguientes preguntas:

a) Suponiendo la existencia de una relación de tipo lineal entre tiempo de conexión y gasto telefónico, ¿qué porcentaje de las variaciones en la cuantía de la factura telefónica no podrían ser explicadas por el tiempo de conexión a Internet dentro de la compañía?

a) 100% - r^2= 100%- .970066= 3% (ejercicio a porcentaje no explicado).
Indica que el 3% no puede ser explicado por el tiempo de conexión a Internet dentro de la compañía, es decir, el cobro total no depende únicamente del tiempo de conexión a Internet sino a otros factores, por ejemplo, llamadas a larga distancia, etc.    

b) ¿Qué tan intensa es la relación entre las variables? 

b) r= raíz cuadrada de SSR/SST= .9849
Influye el tiempo de conexión con la factura del teléfono (costo), es decir, existe una relación entre el costo y el tiempo de conexión a Internet.



c) El modelo de la recta ajustada para esta muestra servirá para realizar predicciones en la población con una confianza del 90%, si es asi, ¿cuál sería el gasto telefónico estimado según esta relación lineal si el tiempo de conexión a internet fuera de 5000 minutos?
 
 c) y= a+bx
 
Donde a= 39.56 y b=.1054

Sustituye

Y=39.56+.1054(5000) = 566.56
Por lo tanto el costo del teléfono por 5000 minutos sería de 566.56 euros.



jueves, 21 de octubre de 2010

Aplicaciones de la estadística a una empresa

Exposición 1.
Para realizar el siguiente ejercicio se utilizó excel para generar números aleatorios con muestras que contienen 1 millón de datos, acotados entre 100 y 3000, que en este caso son los precios de los productos vendidos en cada uno de los departamentos en los que se trabaja.
Supón que eres empleado de una tienda y tu jefe te pide que obtengas las estadísticas de cinco departamentos los cuales vendieron 100 mil productos cada uno. Los precios de los productos oscilan entre 100 pesos y 3000 pesos.
Encuentra para cada departamento:

1. El promedio de las ventas.
2. La varianza de las ventas.
3. La desviación tipíca de las ventas.
4. La mediana de las ventas.
5. La moda de las ventas.
6. El sesgo de las ventas.
7. La curtosis de las ventas.
8. Encuentra el número de productos cuyo precio esta entre: 100-300, 400-600, 700-900, 100-1200, 1300-1500, 1600-1800, 1900-2100, 2200-2400, 2500-2700, 2800-3000.
9. Muestra la información anterior en un histograma.

Resultados










Considerando el análisis estadístico anterior responde a las siguientes preguntas:
1. ¿Cuál de los departamentos tuvo las mejores ventas?, ¿por qué?
El departamento 5, debido a que su promedio fue de un valor de 1550.894, lo cual indica que el promedio de ventas de dicho departamento ha sido el más alto a comparación de los demás puestos, es decir, vende más que los demás puestos, por lo tanto, es el departamento que más conviene mantener en producción.
2. ¿Cuál de los departamentos tuvo las peores ventas?, ¿por qué?
El departamento 4, debido a que su promedio fue de tan solo 1546.975, lo cual indica que el promedio de ventas de dicho departamento ha sido el más bajo a comparación de los demás puestos, es decir, no vende tanto como los demás departamentos, por lo tanto no conviene mantener el puesto en producción.
3. ¿Cuál de los departamentos tuvo una venta más homogénea?, ¿por qué?
El departamento 1, debido a que su desviación típica fue de 836.5389, obtuvo un resultado menor que los demás departamentos, lo que indica que se mantuvo en mayor equilibrio la venta de varios productos y se vendió de todo en precios cercanos.

4. ¿En cuál de los departamentos se vendieron los productos más caros y más baratos?, ¿por qué?
El departamento 2, debido a que la desviación típica nos indica que fue de 839.0472, obtuvo un resultado mayor que los demás departamentos, se vendieron los productos más caros y a la vez, más baratos, lo cual me indica que no obtuvo una venta homogénea, es decir un mayor equilibrio de ventas, al contrario, la venta fue de un extremo a otro.
5. Si te pidieran surtir tres tipos de mercancías, ¿cuáles surtirías?, ¿porqué?
El producto x que oscila entre los precios de 400 y 600
El producto y que oscila entre los precios de 700 y 900
El producto z que oscila entre los precios de 1300 y 1500
Se eligieron los primeros tres totales mayores para surtir; debido a que, en el total de la suma de las frecuencias de los productos de los 5 departamentos indican que fueron los que mejor venta tuvieron, esa es la razón por la cual se eligieron para surtir. 

En la gráfica podemos observar que existe una mayor frecuencia de ventas de productos de dichos precios, lo que indica que se venden con mayor frecuencia que todos los demás, por lo tanto me conviene surtir esos dulces porque son los que más se venden.



Estadística descriptiva

Tarea 1. Puestos de dulces
Supón que eres un empresario y que tienes 5 puestos de dulces como los mostrados en la figura anterior. Los precios de los dulces oscilan entre un peso y 10 pesos. Las ventas para los primeros cinco dias de los puestos se muestran en el siguiente recuadro:




Para los datos anteriores encuentra:
1. Las ventas totales para cada uno de los puestos.
2. El promedio de ventas para cada uno de los puestos.
3. La varianza de ventas de cada uno de los puestos.
4. La desviación típica de ventas de cada uno de los puestos.
5. La mediana de ventas de cada uno de los puestos.
6. La moda de ventas de cada uno de los puestos.
7. El sesgo de ventas de cada uno de los puestos.
8. La curtosis de cada uno de los puestos.

 

Considerando el análisis estadístico anterior responde a las siguientes preguntas:

1. Si tuvieras que cerrar un puesto, ¿cuál cerrarías?, ¿por qué?
El puesto 4, porque su promedio fue de 4, lo cual indica que el promedio de ventas de dicho puesto ha sido el más bajo a comparación de los demás puestos, es decir, no vende tanto como los demás puestos, por lo tanto no conviene mantener el puesto en producción.

2. ¿Cuál de los puestos tuvo una venta más homogénea?, ¿por qué?
El puesto 1, porque su desviación típica fue de 2.07364414, obtuvo un resultado menor  que  los demás puestos, lo que indica que se mantuvo en mayor equilibrio la venta de varios productos y se vendió de todo en precios cercanos.

3. ¿En cuál de los puestos se vendieron los dulces más caros y más baratos?, ¿por qué?
En el puesto 5 porque su desviación típica fue de 3.78153408, obtuvo un resultado mayor que los demás puestos, se vendieron los productos más caros y a la vez, más baratos, lo cual me indica que no obtuvo una venta homogénea, es decir un mayor equilibrio de ventas, al contrario, la venta fue de un extremo a otro.

4. Si tuvieras el presupuesto solo para surtir un tipo de dulce, ¿cuál sería el más recomendable surtir?, ¿por qué?
El dulce cuyo precio oscila entre 1 y 2 pesos, en la gráfica podemos observar que existe una mayor frecuencia de ventas de productos de dichos precios, lo que indica que se venden con mayor frecuencia que todos los demás, por lo tanto me conviene surtir esos dulces porque son los que más se venden.