La media aritmética es la medida de posición utilizada con más frecuencia. Si se tienen n valores de observaciones, la media aritmética es la suma de todos y caca uno de los valores dividida entre el total de valores: Lo que indica que puede ser afectada por los valores extremos, por lo que puede dar una imagen distorcionada de la información de los datos.
La Mediana, es el valor que ocupa la posición central en un conjunto de datos, que deben estar ordenados, de esta manera la mitad de las observaciones es menor que la mediana y la otra mitad es mayor que la mediana, resulta muy apropiada cuando se poseen observaciones extremas.
La Moda es el valor de un conjunto de datos que aparece con mayor frecuencia. No depende de valores extremos, pero es más variables que la media y la mediana.
Rango Medio es la media de las observaciones menor y mayor. como intervienen solamente estas observaciones, si hay valores extremos, se distorsiona como medida de posición, pero
No Agrupados
Analicemos para ello las edades que utilizamos cuando se vió la organización y presentación de datos discretos:
12
|
15
|
14
|
15
|
16
|
18
|
19
|
14
|
15
|
17
|
15
|
17
|
18
|
16
|
19
|
16
|
17
|
15
|
15
|
17
|
16
|
18
|
17
|
19
|
17
|
23
|
16
|
17
|
18
|
19
|
Estos fueron loa datos mostrados originalmente, no se han ordenado ni agrupado, determinemos ahora los valores de la Media, la Mediana y la moda, para ello recurramos a las fórmulas de estas medidas que resumimos en la siguiente tabla:
Medida
|
Formula
|
Observaciones
|
Media
|
|
Donde xi se refiere a todo y cada uno de los elementos de la muestra y n es el numero total de elementos en la muestra.
|
Mediana
|
a) p = (n/2)
|
Es la posición en donde se encuentra la mediana.
Si n es impar, entonces es la opción a, en caso contrario, la b.
El valor de la mediana se obtiene por observación
|
b) p = (n/2) + 1
|
Moda
|
|
Se obtiene el valor por observación
|
Rango Medio
|
(Valor máximo + Valor Mínimo) / 2
|
|
Aplicando, se obtienen los siguientes valores:
Para la media:
_ 12 + 15 + 14 + 15 + 16 + 18 + 19 + 14 + 15 + 17 + 15 + 17 + 18 + 16 + 19 + 16 + 17 + 15 + 15 + 17 + 16 + 18 + 17 + 19 + 17 + 23 + 16 + 17 + 18 + 19
X = -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
30
_ 500
X = ------------ = 16.6667
30
Para la mediana debera ordenarse el grupo de datos, como n = 30, utilizaremos la posición p = (30/2) = 15, el primer valor mayor a 15 corresponde a la clase 17.
La moda estaría determinada por observación directa, y correspondería al valor 17, que se presenta hasta 7 veces en la muestra.
El rango medio se determina por la suma entre 23 y 12 dividido entre 2 (23 + 12)/2 = 35/2 = 17.5
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se obtiene tuvo que ordenar la información (así lo específica la definición), sin embargo podemos también observar que este ordenamiento no afecta de manera directa ninguno de los cálculos, de esta manera se puede construir la siguiente tabla:
Medida
|
Valor Calculado
|
Observaciones
|
Media
|
16.6667
|
|
Mediana
|
17
|
Se requirió el cálculo de la frecuencia acumulada
|
Moda
|
17
|
|
Rango Medio
|
17.5
|
|
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 17, no se notan cambios en los resultados comparados con los datos originales, sin embargo las formulas si se ven modificadas.
Agrupados
Recurramos ahora al agrupamiento de los datos discretos del ejercicio que hemos estado utilizando:
Clase
|
Repeticiones
|
Total de Años de la clase
|
12
|
1
|
12
|
14
|
2
|
28
|
15
|
6
|
90
|
16
|
5
|
80
|
17
|
7
|
119
|
18
|
4
|
72
|
19
|
4
|
76
|
23
|
1
|
23
|
Total
|
30
|
500
|
En donde podemos observar la suma de las frecuencias y de los años multiplicados por la clase que agrupa a los datos coinciden con los datos utilizados cuando no se agruparon en la sección anterior, utilizando ahora las formulas de la siguiente tabla:
Medida
|
Formula
|
Observaciones
|
Media
|
|
Donde xi se refiere a todo y cada uno de los elementos de la muestra y n es el número total de elementos en la muestra y fi se refiere a la frecuencia de la clase.
|
Mediana
|
p = (n/2)
|
Es la posición en donde se encuentra la mediana.
Se ubica en la tabla el primer valor de frecuencia acumulada mayor a la posición calculada, si ese valor es mayor, entonces la mediana es la clase correspondiente al mismo. Si el valor es igual a la posición, entonces se suman el valor anterior más el valor obtenido y se divide entre 2.
|
Moda
|
|
Se obtiene el valor por observación de la mayor frecuencia
|
Rango Medio
|
(Valor máximo + Valor Mínimo) / 2
|
|
Aplicando, se obtienen los siguientes valores:
Para la media:
_ 12 * 1 + 14 * 2 + 15 * 6 + 16 * 5 + 17 * 7 + 18 * 4 + 19 * 4 + 23 * 1 12 + 28 + 90 + 80 + 119 + 72 + 76 + 23
X = -------------------------------------------------------------------------------------------- = ---------------------------------------------------------------
30 30
_ 500
X = ------------ = 16.6667
30
Para la Mediana, utilizaremos la frecuencia acumulada:
Clase
|
Frecuencia
|
Frecuencia Acumulada
|
12
|
1
|
1
|
14
|
2
|
3
|
15
|
6
|
9
|
16
|
5
|
14
|
17
|
7
|
21
|
18
|
4
|
27
|
19
|
4
|
29
|
23
|
1
|
30
|
Total
|
30
|
|
Como n = 30, utilizaremos la posición p = (30/2) = 15, el primer valor mayor a 15 corresponde a la clase 17.
La moda estaría determinada por observación directa, y correspondería al valor 17, que se presenta hasta 7 veces en la muestra.
El rango medio se determina por la suma entre 23 y 12 dividido entre 2 (23 + 12)/2 = 35/2 = 17.5
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se obtiene tuvo que ordenar la información (así lo específica la definición), sin embargo podemos también observar que este ordenamiento no afecta de manera directa ninguno de los cálculos, de esta manera se puede construir la siguiente tabla:
Medida
|
Valor Calculado
|
Observaciones
|
Media
|
16.6667
|
|
Mediana
|
17
|
Se requirió el cálculo de la frecuencia acumulada
|
Moda
|
17
|
|
Rango Medio
|
17.5
|
|
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 17, no se notan cambios en los resultados comparados con los datos originales, sin embargo las formulas si se ven modificadas.
Datos Continuos
No agrupados
Las medidas de tendencia central para datos continuos no agrupados no tienen mayor significación, ya que el comportamiento es similar al de datos discretos no agrupados, por ello utilizaremos las mismas formúlas, pero ahora con los datos continuos del ejercicio de la sección correspondiente:
1.25
|
1.2
|
1.28
|
1.29
|
1.2
|
1.24
|
1.27
|
1.21
|
1.32
|
1.27
|
1.18
|
1.29
|
1.2
|
1.23
|
1.25
|
1.28
|
1.24
|
1.28
|
1.27
|
1.25
|
1.24
|
1.25
|
1.27
|
1.28
|
1.29
|
1.18
|
1.21
|
1.24
|
1.2
|
1.23
|
1.25
|
1.27
|
1.28
|
1.24
|
1.29
|
1.21
|
Aplicando, se obtienen los siguientes valores:
Para la media, aplicando la formula de la media para datos no agrupados (vista en la sección de datos discretos):
_ 1.25 + 1.2 + 1.28+1.29+1.2 + 1.24 + 1.27 + 1.21 + 1.32 + 1.27 + 1.18 + 1.29 + 1.2 + 1.23 + 1.25 + 1.28 + 1.24 + 1.28 + 1.27 + 1.25 + 1.24 + 1.25 + 1.27 + 1.28 + 1.29 + 1.28 + 1.21 + 1.24 + 1.2 + 1.23 + 1.25 + 1.27 + 1.28 + 1.24 + 1.29 + 1.21
X = ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
30
_ 44.93
X = ------------ = 1.24805556
30
Para la Mediana, como n = 36, es par, utilizaremos la posición p = (36/2) = 18
Por lo que la mediana se encontrará entre los valores que se ubiquen (de manera ordenada) entre las posiciones 18 y 19 (observa que antes de esa posición hay 17 y después también hay 17 valores), se encuentran 1.25 y 1.25, por lo que la mediana sería 1.25.
La moda estaría determinada por observación directa, y corresponderían a los valores 1.24, 1.25 y 1.27 que se repiten en la muestra 5 veces, por lo que la característica según la moda es una muestra trimodal (normalmente se le conoce como multimodal).
El rango medio se determina por la sumaentre 1.18 y 1.32 dividido entre 2 (1.18 + 1.32)/2 = 2.5 / 2 = 1.25
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se tuvo que ordenar la información (así lo específica la definición), sin embargo podemos también observar que este ordenamiento no afecta de manera directa ninguno de los cálculos, de esta manera se puede construir la siguiente tabla:
Medida
|
Valor Calculado
|
Observaciones
|
Media
|
1.24805556
|
|
Mediana
|
1.25
|
Se requirió del ordenamiento de los datos
|
Moda
|
1.24,1.25, 1.27
|
Muestra multimodal
|
Rango Medio
|
1.25
|
|
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 1.25.
Agrupados
Retomando los cálculos realizados en la sección correspondiente a organización y presentación de datos continuos agrupados.
Clases
|
Li
|
Ls
|
Mc
|
F
|
fa
|
fc
|
fr
|
fra
|
frc
|
I
|
1.175
|
1.203
|
1.189
|
6
|
6
|
30
|
16.67%
|
16.67%
|
83.33%
|
II
|
1.213
|
1.241
|
1.227
|
10
|
16
|
20
|
27.78%
|
44.44%
|
55.56%
|
III
|
1.251
|
1.279
|
1.265
|
10
|
26
|
10
|
27.78%
|
72.22%
|
27.78%
|
IV
|
1.289
|
1.317
|
1.303
|
9
|
35
|
1
|
25.00%
|
97.22%
|
2.78%
|
V
|
1.327
|
1.355
|
1.341
|
1
|
36
|
0
|
2.78%
|
100.00%
|
0.00%
|
En ella se pueden observar los límites superiores e inferiores de cada clase, lo que indica (de no conocer los datos originales) que por ejemplo esos 6 valores de la clase pueden ubicarse en cualquier valor del rango, pueden ser por ejemplo 1.17, 1.171, 1.20, 1.202, 1.18, 1.1901.
Es decir pueden tomar cualquier valor dentro del rango lo que dificulta tomar estos parametros como elementos para el cálculo de las medidas de tendencia central, por ello se realizó el cálculo de la Mc (Marca de Clase) que en otras palabras es el rango medio de cada clase, que servirá para el cálculo de la media como lo establecemos en la siguiente tabla de cálculo para las medidas de tendencia central:
Medida
|
Formula
|
Observaciones
|
Media
|
|
Donde Mc se refiere a la marca de clase de cada clase, n es el número total de elementos en la muestra y fi se refiere a la frecuencia de la clase.
|
Mediana
|
p = (n/2)
|
Es la posición en donde se encuentra la mediana.
Se ubica en la tabla el primer valor de frecuencia acumulada mayor a la posición calculada.
El valor de la mediana se calcula tomando la formula del 5to. Decil.
|
Moda
|
|
Donde Li es el límite inferior de la clase que tiene la mayor frecuencia.
fm es la frecuencia modal (aquella donde se encuentra la frecuencia mayor)
f(m -1) es la frecuencia anterior a la frecuencia modal, en caso de encontrarse en la primera clase, este valor es cero.
F(m+1) es la frecuencia posterior a la frecuencia modal, en caso de encontrarse en la última clase, este valor es cero.
A es la amplitud de la clase modal.
|
Rango Medio
|
(Valor máximo + Valor Mínimo) / 2
|
|
Aplicandolas para calcular la media y complementando la tabla anterior:
Clases
|
Li
|
Ls
|
Mc
|
F
|
fa
|
fc
|
fr
|
fra
|
frc
|
Mc * f
|
I
|
1.175
|
1.203
|
1.189
|
6
|
6
|
30
|
16.67%
|
16.67%
|
83.33%
|
7.134
|
II
|
1.213
|
1.241
|
1.227
|
10
|
16
|
20
|
27.78%
|
44.44%
|
55.56%
|
12.27
|
III
|
1.251
|
1.279
|
1.265
|
10
|
26
|
10
|
27.78%
|
72.22%
|
27.78%
|
12.65
|
IV
|
1.289
|
1.317
|
1.303
|
9
|
35
|
1
|
25.00%
|
97.22%
|
2.78%
|
11.727
|
V
|
1.327
|
1.355
|
1.341
|
1
|
36
|
0
|
2.78%
|
100.00%
|
0.00%
|
1.341
|
|
36
|
|
45.122
|
Con fundamento en la tabla podemos entonces obtener:
45.122
Media = ---------------- = 1.253388889
36
Para el cálculo de la mediana, se utiliza la formula del 5to. Decil (puede ser el 50tavo percentil), para ello determinamos la posición de este estadígrafo, p = (36/10)*5 = 3.6 * 5 = 18.
Con este valor recurrimos a la columna de la frecuencia acumulada y observarmos que el primer elemento mayor al valor calculado se ubica en la clase III, aplicando la fórmula obtenemos:
((36/10)*5 – 16) (18 – 16)
Mediana = 1.251 + (----------------------------) * 0.028 = 1.251 + (---------------) * 0.028
10 10
2
Mediana = 1.251 + ( ---------) * 0.028 = 1.251 + (0.2 * 0.028) = 1.251 + 0.0056 = 1.2566
10
La moda se encontraría en las clases II y III, son las que mayores frecuencias manifiestan, por lo tanto podemos definir que existen una característica de multimodalida en la muestra, calculemos la primera moda (dejamos como actividad complementaria el cálculo de la segunda moda).
( 10 – 6) 4
Mo = 1.213 + ( -------------------------) 0.028 = 1.213 + (--------) * 0.028 = 1.213 + 0.028
(2* 10 – 6 – 10) 4
Mo = 1.241
El rango medio se determina por la sumaentre 1.18 y 1.32 dividido entre 2 (1.18 + 1.32)/2 = 2.5 / 2 = 1.25
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se tuvo que ordenar la información (así lo específica la definición), sin embargo podemos también observar que este ordenamiento no afecta de manera directa ninguno de los cálculos, de esta manera se puede construir la siguiente tabla:
Medida
|
Valor Calculado
|
Observaciones
|
Media
|
1.253388889
|
|
Mediana
|
1.2566
|
Se requirió del uso de fórmulas del 5to decil, se pudieron usar las de 50tavo centil.
|
Moda
|
1.241
|
Muestra multimodal, solo se calculó la primera moda
|
Rango Medio
|
1.25
|
|
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 1.25.
Construyamos una tabla comparativa de resultados de cálculo de estas medidas;
Medida
|
No agrupados
|
Agrupados
|
Media
|
1.24805556
|
1.253388889
|
Mediana
|
1.25
|
1.2566
|
Moda
|
1.24,1.25, 1.27
|
1.241
|
Rango Medio
|
1.25
|
1.25
|