Cómo calcular la variación en las estadísticas

Tabla de contenido:

Anonim

Uno de los conceptos más básicos en estadística es el promedio, o significado aritmetico, de un conjunto de números. La media significa un valor central para el conjunto de datos. los diferencia de un conjunto de datos mide qué tan lejos se separan los elementos de ese conjunto de datos de la media. Los conjuntos de datos en los que los números están todos cerca de la media tendrán una varianza baja. Aquellos conjuntos en los que los números son mucho más altos o más bajos que la media tendrán una varianza alta.

Calcular la media del conjunto de datos

Calcular las diferencias al cuadrado

El siguiente paso consiste en calcular la diferencia entre cada elemento en el conjunto de datos y la media. Dado que algunos elementos serán más altos que la media y otros serán más bajos, el cálculo de la varianza utiliza el cuadrado de las diferencias.

Ventas del Día 1 - Ventas medias: $ 62,000 - $ 65414.29 = (- $ 3,414.29); (-3,414.29)2 = 11,657,346.94

Ventas del día 2 - Ventas medias: $ 64,800- $ 65414.29 = (- $ 614.29); (-614.29)2 = 377,346.94

Ventas del Día 3 - Ventas medias: $ 62,600 - $ 65414.29 = (- $ 2,814.29); (-2,814.29)2 = 7,920,204.08

Ventas del día 4 - Ventas medias: $ 69,200 - $ 65414.29 = (+ $ 3,785.71); (+3,785.71)2 = 14,331,632.65

Ventas del día 5 - Ventas medias: $ 66,000 - $ 65414.29 = (+ $ 585.71); (+585.71)2 = 343,061.22

Ventas del día 6 - Ventas medias: $ 63,900 - $ 65414.29 = (- $ 1,514.29); (-1,514.29)2 = 2,293,061.22

Ventas del día 7 - Ventas medias: $ 69,400 - $ 65414.29 = (+ $ 3,985.71); (+3,985.71)2 = 15,885,918.37

NOTA: Las diferencias al cuadrado no se miden en dólares. Estos números se utilizan en el siguiente paso para calcular la varianza.

Variación y desviación estándar

La varianza se define como la media de las diferencias al cuadrado.

11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43

52,808,571.43/7 = 7,544,081.63

Como la varianza usa el cuadrado de la diferencia, la raíz cuadrada de la varianza dará una indicación más clara de la dispersión real. En estadística, la raíz cuadrada de la varianza se denomina desviación estándar.

SQRT (7,544,081.63) = $ 2,746.65

Usos de variación y desviación estándar

Tanto la varianza como la desviación estándar son muy útiles en el análisis estadístico. La varianza mide la distribución general de un conjunto de datos a partir de la media. La desviación estándar ayuda en la detección. valores atípicos, o elementos del conjunto de datos que se alejan demasiado de la media.

En el conjunto de datos anterior, la variación es bastante alta, con solo dos totales de ventas diarias que llegan a menos de $ 1,000 de la media. El conjunto de datos también muestra que dos de los siete totales de ventas diarias son más de una desviación estándar por encima de la media, mientras que otros dos son más de una desviación estándar por debajo de la media.