UNIDAD DIDÁCTICA: ESTADÍSTICA. DISTRIBUCIONES BIDIMENSIONALES. |
|
Curso: Estadística 2º Bachillerato. | |
2. TABLAS DE FRECUENCIAS. |
Para hacer un estudio de una variable estadística bidimensional, tendremos que recoger de cada individuo dos datos. Estos datos correspondientes a un mismo individuo no se pueden separar, pues vamos a estudiar la relación que existe entre ellos. Los recogeremos formando pares de elementos (x1,y1), (x2,y2), ... (xn,yn), en los que el primer elemento pertenece a la primera de las características observadas y el segundo elemento a la segunda característica. |
Una vez que hemos recogido todos los datos, habrá que organizarlos, para ello utilizaremos las tablas de frecuencia, que en el caso bidimensional podrán ser de dos clases: tablas simples y tablas de doble entrada o tablas de contingencia. Dependiendo de la cantidad de datos que tengamos, de la frecuencia de los mismos y de que para un mismo valor de una de las variables, se presenten varios valores de las otras, utilizaremos una u otra: |
Tabla bidimensional simple. Está formada por tres filas en las que se representan: en la primera de ellas los valores de la primera variable, en la segunda fila los de la segunda variable y en la tercera las correspondientes frecuencias. Está indicada para casos con pocos datos y pocos valores o ninguno repetidos. Es la tabla correspondiente al ejemplo de la página anterior. |
xi | x1 | x2 | ... | xi | ... | xm | |
yj | y1 | y2 | ... | yj | ... | yn | |
fij | f11 | f22 | ... | fij | ... | fmn | N |
En caso de que las frecuencias sean iguales a uno, se puede omitir la fila o columna correspondiente a dichas frecuencias. Escogiendo la fila de cada una de las variables junto con la fila de las frecuencias, tenemos la correspondiente tabla de cada una de las variables unidimensionales, que llamaremos distribución marginal de X o de Y, respectivamente. A partir de las distribuciones marginales podremos calcular la media, la desviación típica y todos los párametros vistos en el tema anterior de las variables unidimensionales. |
Tabla de doble entrada. Está formada por tantas filas como valores tengamos de la variable Y y tantas columnas como valores tengamos de la variable X, y una fila y una columna más para indicar los totales. Está indicada para casos con bastantes datos, en los que para cada valor de una variable, existen varios valores de la otra. |
x1 | x2 | ... | xi | ... | xm | Frecuencia absoluta de la variable Y | |
y1 | f11 | f21 | ... | fi1 | ... | fm1 | Σfi1 |
y2 | f12 | f22 | ... | fi2 | ... | fm2 | Σfi2 |
... | ... | ... | ... | ... | ... | ... | ... |
yj | f1j | f2j | ... | fij | ... | fmj | Σfij |
... | ... | ... | ... | ... | ... | ... | ... |
yn | f1n | f2n | ... | fin | ... | fmn | Σfin |
Frecuencia absoluta de la variable X | Σf1j | Σf2j | ... | Σfij | ... | Σf1n | N |
Escogiendo la primera y la última fila, tenemos la tabla estadística correspondiente a la distribución marginal de la primera variable unidimensional, X. Con la primera y última columnas construimos la tabla correspondiente a la distribución marginal de la segunda variable unidimensional, Y. En la última celda aparecerá el total de la última fila y de la última columna, es decir, el número total de elementos estudiados (N). En el caso de que alguna de las variables sea continua, aparecerán los distintos intervalos en la correspondiente fila o columna y otra fila o columna más con las marcas de clase de cada intervalo. No vamos a tener problema en representar los datos de una forma o de otra, es decir, vamos a poder pasar de tabla simple a tabla de doble entrada y viceversa. A veces nos interesa estudiar como se comporta una de las variables para un determinado valor de la otra variable, a la nueva distribución así obtenida la llamaremos distribución condicionada, X/Y=yj, o bien, Y/X = xi, según condicionemos a un valor de una u otra variable. Nuevamente al volverse a tratar de una variable unidimensional podremos estudiar todos los parámetros estadísticos vistos en el anterior tema. |
Ejemplo 2. En una clase de 30 alumnos y alumnas se ha realizado un estudio sobre el número de horas diarias de estudio X y el número de asignaturas suspensas al final de curso Y, obteniendo los siguientes datos. Construir la tabla de doble entrada y calcular la media y desviación típica de cada una de las variables. (2,0) , (2,2) , (0,5) , (2,1) , (1,2) , (2,1) , (3,1) , (4,0) , (0,4) , (2,2) , (2,1) , (2,1) , (4,0) , (3,1) , (2,4) (2,1) , (1,2) , (2,1) , (2,0) , (3,0) , (3,1) , (2,2) , (2,2) , (2,1) , (0,5) , (1,3) , (2,2) , (2,1) , (1,3) , (1,4) |
PÁGINA ANTERIOR | ÍNDICE | PÁGINA SIGUIENTE |
1. VARIABLES BIDIMENSIONALES | 2. TABLAS DE FRECUENCIAS | 3. DIAGRAMA DE DISPERSIÓN | 4. DEPENDENCIA Y CORRELACIÓN |
5. CORRELACIÓN LINEAL | 6. REGRESIÓN LINEAL | 7. EJERCICIOS | 8. BIBLIOGRAFÍA |
Luis Barrios Calmaestra |
© Ministerio de Educación. Año 2009 |
Los contenidos de esta unidad didáctica están bajo una licencia de Creative Commons si no se indica lo contrario.