Desviación Estándar y Coeficiente de Correlación

Desviación Estándar

La desviación estándar es una medida de dispersión que indica cuánto se desvían los datos respecto a la media. La fórmula para la desviación estándar es:

$$ \sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \bar{x})^2} $$

donde:

Ejemplo Básico

Consideremos el conjunto de datos \( X = \\{3, 5, 7, 7, 9\\} \). Sigamos los pasos para calcular la desviación estándar:

  1. Calcular la media \( \bar{x} = \frac{3 + 5 + 7 + 7 + 9}{5} = 6.2 \).
  2. Calcular \( (x_i - \bar{x})^2 \) para cada valor y luego la suma:

    $$ (3 - 6.2)^2 + (5 - 6.2)^2 + (7 - 6.2)^2 $$

    $$ + (7 - 6.2)^2 + (9 - 6.2)^2 = 26.8 $$

  3. Dividir por \( N = 5 \) y luego tomar la raíz cuadrada:

    $$ \sigma = \sqrt{\frac{26.8}{5}} \approx 2.32 $$

Ejemplo Avanzado

Consideremos el conjunto de datos \( X = \{10, 12, 23, 23, 16, 23, 21, 16\} \). Vamos a calcular la desviación estándar:

  1. Calcular la media \( \bar{x} = \frac{10 + 12 + 23 + 23 + 16 + 23 + 21 + 16}{8} = 18 \).
  2. Calcular \( (x_i - \bar{x})^2 \) para cada valor y luego la suma:

    $$ (10 - 18)^2 + (12 - 18)^2 + (23 - 18)^2 + $$

    $$(16 - 18)^2 + (23 - 18)^2 $$

    $$(23 - 18)^2 + + (21 - 18)^2 + (16 - 18)^2 = 176 $$

  3. Dividir por \( N = 8 \) y luego tomar la raíz cuadrada:

    $$ \sigma = \sqrt{\frac{176}{8}} = 4.69 $$

Coeficiente de Correlación de Pearson

El coeficiente de correlación de Pearson mide la relación entre dos variables. Su fórmula es:

$$ r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \cdot \sum (y_i - \bar{y})^2}} $$

donde:

Ejemplo Básico

Consideremos los conjuntos de datos \( X = \{1, 2, 3, 4, 5\} \) y \( Y = \{2, 4, 6, 8, 10\} \). Vamos a calcular \\( r \\):

  1. Calcular \( \bar{x} = 3 \) y \( \bar{y} = 6 \).
  2. Calcular \( (x_i - \bar{x})(y_i - \bar{y}) \) para cada par y luego la suma:

    $$ \sum (x_i - \bar{x})(y_i - \bar{y}) = 20 $$

  3. Calcular \( \sum (x_i - \bar{x})^2 = 10 \) y \( \sum (y_i - \bar{y})^2 = 40 \).
  4. Calcular \( r \):

    $$ r = \frac{20}{\sqrt{10 \cdot 40}} = 1 $$

Ejemplo Avanzado

Consideremos los conjuntos de datos \( X = \{43, 21, 25, 42, 57, 59\} \) y \( Y = \{99, 65, 79, 75, 87, 81\} \):

  1. Calcular \( \bar{x} = 41 \) y \( \bar{y} = 81 \).
  2. Calcular \( (x_i - \bar{x})(y_i - \bar{y}) \) para cada par y luego la suma:

    $$ \sum (x_i - \bar{x})(y_i - \bar{y}) = 760 $$

  3. Calcular \( \sum (x_i - \bar{x})^2 = 946 \) y \( \sum (y_i - \bar{y})^2 = 558 \).
  4. Calcular \( r \):

    $$ r = \frac{760}{\sqrt{946 \cdot 558}} \approx 0.894 $$

Ir a Ejersisio