Desviación Estándar y Coeficiente de Correlación
Desviación Estándar
La desviación estándar es una medida de dispersión que indica cuánto se desvían los datos respecto a la media. La fórmula para la desviación estándar es:
$$ \sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \bar{x})^2} $$
donde:
- \( N \): el número total de datos.
- \( x_i \): cada valor individual en el conjunto de datos.
- \( \bar{x} \): la media del conjunto de datos.
Ejemplo Básico
Consideremos el conjunto de datos \( X = \\{3, 5, 7, 7, 9\\} \). Sigamos los pasos para calcular la desviación estándar:
- Calcular la media \( \bar{x} = \frac{3 + 5 + 7 + 7 + 9}{5} = 6.2 \).
- Calcular \( (x_i - \bar{x})^2 \) para cada valor y luego la suma:
$$ (3 - 6.2)^2 + (5 - 6.2)^2 + (7 - 6.2)^2 $$
$$ + (7 - 6.2)^2 + (9 - 6.2)^2 = 26.8 $$
- Dividir por \( N = 5 \) y luego tomar la raíz cuadrada:
$$ \sigma = \sqrt{\frac{26.8}{5}} \approx 2.32 $$
Ejemplo Avanzado
Consideremos el conjunto de datos \( X = \{10, 12, 23, 23, 16, 23, 21, 16\} \). Vamos a calcular la desviación estándar:
- Calcular la media \( \bar{x} = \frac{10 + 12 + 23 + 23 + 16 + 23 + 21 + 16}{8} = 18 \).
- Calcular \( (x_i - \bar{x})^2 \) para cada valor y luego la suma:
$$ (10 - 18)^2 + (12 - 18)^2 + (23 - 18)^2 + $$
$$(16 - 18)^2 + (23 - 18)^2 $$
$$(23 - 18)^2 + + (21 - 18)^2 + (16 - 18)^2 = 176 $$
- Dividir por \( N = 8 \) y luego tomar la raíz cuadrada:
$$ \sigma = \sqrt{\frac{176}{8}} = 4.69 $$
Coeficiente de Correlación de Pearson
El coeficiente de correlación de Pearson mide la relación entre dos variables. Su fórmula es:
$$ r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \cdot \sum (y_i - \bar{y})^2}} $$
donde:
- \( x_i \) y \( y_i \): los valores individuales de las variables \( X \) y \( Y \).
- \( \bar{x} \) y \( \bar{y} \): las medias de \( X \) y \( Y \).
Ejemplo Básico
Consideremos los conjuntos de datos \( X = \{1, 2, 3, 4, 5\} \) y \( Y = \{2, 4, 6, 8, 10\} \). Vamos a calcular \\( r \\):
- Calcular \( \bar{x} = 3 \) y \( \bar{y} = 6 \).
- Calcular \( (x_i - \bar{x})(y_i - \bar{y}) \) para cada par y luego la suma:
$$ \sum (x_i - \bar{x})(y_i - \bar{y}) = 20 $$
- Calcular \( \sum (x_i - \bar{x})^2 = 10 \) y \( \sum (y_i - \bar{y})^2 = 40 \).
- Calcular \( r \):
$$ r = \frac{20}{\sqrt{10 \cdot 40}} = 1 $$
Ejemplo Avanzado
Consideremos los conjuntos de datos \( X = \{43, 21, 25, 42, 57, 59\} \) y \( Y = \{99, 65, 79, 75, 87, 81\} \):
- Calcular \( \bar{x} = 41 \) y \( \bar{y} = 81 \).
- Calcular \( (x_i - \bar{x})(y_i - \bar{y}) \) para cada par y luego la suma:
$$ \sum (x_i - \bar{x})(y_i - \bar{y}) = 760 $$
- Calcular \( \sum (x_i - \bar{x})^2 = 946 \) y \( \sum (y_i - \bar{y})^2 = 558 \).
- Calcular \( r \):
$$ r = \frac{760}{\sqrt{946 \cdot 558}} \approx 0.894 $$