Icono del sitio Docentes digitalestv.org

Medidas de dispersión y posición explicación

Medidas de dispersión y posición explicación

Medidas de dispersión y posición explicación

En estadística, las medidas de dispersión y posición son herramientas muy útiles que se utilizan para describir y analizar conjuntos de datos. Las medidas de dispersión nos indican cuántos dispersos o variados están los datos en relación a su valor central, mientras que las medidas de posición nos dan información sobre la posición relativa de los datos en un conjunto.

En este artículo, explicaremos en detalle qué son las medidas de dispersión y posición, cómo se calculan y cómo se interpretan. Además, también hablaremos sobre algunas de las medidas de dispersión y posición más comunes que se utilizan en estadística.

Medidas de dispersión

Las medidas de dispersión nos indican cuánto dispersos o variados están los datos en relación a su valor central. En otras palabras, nos dan una idea de la distancia que hay entre los valores individuales y el valor central. Algunas de las medidas de dispersión más comunes son:

Rango

El rango es la diferencia entre el valor máximo y el valor mínimo en un conjunto de datos. Es la medida de dispersión más simple y fácil de calcular, pero también es la menos precisa. El rango no tiene en cuenta la distribución de los datos, por lo que puede ser engañoso en algunos casos.

Desviación estándar

La desviación estándar es una medida de dispersión que nos indica cuánto se desvían los datos de su valor central. Se calcula tomando la raíz cuadrada de la varianza. La varianza es la media de los cuadrados de las desviaciones individuales de los datos con respecto a su valor central.

La desviación estándar es una medida de dispersión más precisa que el rango, ya que tiene en cuenta la distribución de los datos. Si la desviación estándar es grande, significa que los datos están muy dispersos. Si la desviación estándar es pequeña, significa que los datos están muy juntos.

La desviación estándar se calcula tomando la raíz cuadrada de la varianza:

Desviación estándar = √Varianza

varianza

La varianza es la media de los cuadrados de las desviaciones individuales de los datos con respecto a su valor central. Se utiliza para medir cuánto se desvían los datos de su valor central. La variación es una medida de dispersión muy útil, pero puede ser difícil de interpretar debido a que está en unidades cuadradas.

Fórmula de la varianza = Σ (Xi – X)² / N

Donde Xi es el valor de cada punto de datos, X es la media de los datos y N es el número total de datos.

Coeficiente de variación

El coeficiente de variación es una medida de dispersión relativa que se utiliza para comparar la dispersión de dos conjuntos de datos que tienen unidades diferentes. Se calcula dividiendo el desvío estándar por la media y multiplicando por 100.

El coeficiente de variación se expresa en porcentaje y nos indica cuánto variarán los datos en relación a su valor central. Si el coeficiente de variación es alto, significa que los datos están muy dispersos en relación a su valor central. Si el coeficiente de variación es bajo, significa que los datos están muy juntos en relación a su valor central.

Cuartiles

Los cuartiles son valores que dividen un conjunto de datos en cuatro partes iguales. El primer cuartil es el valor que deja el 25% de los datos por debajo de él, el segundo cuartil es la mediana y el tercer cuartil es el valor que deja el 75% de los datos por debajo de él. El rango intercuartílico es la diferencia entre el tercer cuartil y el primer cuartil. Esta medida de dispersión se utiliza para identificar la dispersión de los datos alrededor de la mediana.

medidas de posición

Las medidas de posición nos dan información sobre la posición relativa de los datos en un conjunto. Nos permiten identificar la posición del valor central y la ubicación de los valores extremos.

Las medidas de posición son valores que indican la ubicación de un conjunto de datos en relación con un punto de referencia. Las dos medidas de posición más comunes son la media y la mediana.

Media

La media es la suma de todos los datos divididos por el número total de datos. Es decir, si tenemos los siguientes datos: 2, 4, 6, 8 y 10, los medios serían:

(2 + 4 + 6 + 8 + 10) / 5 = 6

Mediana

La mediana es el valor central de un conjunto de datos. Si el número de datos es impar, la mediana es el valor que se encuentra en el centro de los datos ordenados de menor a mayor. Por ejemplo, si tenemos los siguientes datos: 2, 4, 6, 8 y 10, la mediana sería 6. Si el número de datos es par, la mediana es la media de los dos valores centrales. Por ejemplo, si tenemos los siguientes datos: 2, 4, 6, 8, 10 y 12, la mediana sería:

(6 + 8) / 2 = 7

La mediana es una medida de posición más robusta que la media, ya que no se ve afectada por valores atípicos en el conjunto de datos.

Ejemplos

Ejemplo 1: Desviación estándar

Suponga que tiene un conjunto de datos que representa las calificaciones de un examen para una clase de 30 estudiantes. Los datos se presentan a continuación:

70, 75, 80, 82, 85, 87, 89, 90, 91, 92, 92, 93, 93, 94, 95, 95, 96, 97, 97, 97, 98, 98, 98, 99, 99, 99, 100, 100, 100, 100

Para calcular la desviación estándar, primero necesitamos encontrar los medios de los datos:

Medios = (70 + 75 + 80 + … + 100) / 30 = 91,9

Luego, encontramos la variación:

Varianza = Σ (Xi – X)² / N = ((70-91,9)² + (75-91,9)² + … + (100-91,9)²) / 30 = 83,21

Finalmente, tomamos la raíz cuadrada de la varianza para encontrar la desviación estándar:

Desviación estándar = √Varianza = √83,21 = 9,12

Por lo tanto, la desviación estándar de los datos es de 9.12. Esto significa que las valoraciones varían en promedio alrededor de 9.12 puntos de la media de 91.9.

Ejemplo 2: Rango intercuartil

Supongamos que se está analizando el tiempo que tardan los estudiantes en completar un examen. Los datos se presentan a continuación:

10, 15, 20, 25, 30, 35, 40, 45, 50

Para encontrar el rango intercuartil, primero necesitamos encontrar el primer y tercer cuartil. El primer cuartil se refiere al valor que divide el conjunto de datos en cuatro partes iguales, mientras que el tercer cuartil se refiere al valor que divide el conjunto de datos en tres partes iguales.

Para encontrar el primer cuartil, primero encontramos la mediana de los datos. La mediana es el valor medio en el conjunto de datos, por lo que en este caso la mediana es 30.

A continuación, dividimos los datos en dos grupos: los datos por debajo de la mediana y los datos por encima de la mediana. Los datos por debajo de la mediana son 10, 15, 20 y 25. Para encontrar el primer cuartil, encontramos la mediana de estos datos:

Primer cuartil = mediana de 10, 15, 20, y 25 = (15+20) / 2 = 17.5

Para encontrar el tercer cuartil, dividimos los datos en dos grupos: los datos por encima de la mediana y los datos por debajo de la mediana. Los datos por encima de la mediana son 35, 40, 45, y 50. Para encontrar el tercer cuartil, encontramos la mediana de estos datos:

Tercer cuartil = mediana de 35, 40, 45

Síguenos

Suscríbete para que seas el primero en recibir nuestro contenido en tu correo electrónico

Relacionados

Uso de sustantivos abstractos en la entrevistaGeografía física de AméricaExpresiones según el registro formal e informalGeografía biológica conceptos y característicasPronombres interrogativos y exclamativos en la entrevistaGeografía política conceptos y característicasUso de oraciones de oraciones interrogativas en la entrevistaGeografía económica conceptos y características.

Salir de la versión móvil