Clase Estadisticas, Poblacion, Muestra, Variable
Conceptos de Población y Muestra
Población: Es el conjunto de todos los elementos que cumplen ciertas propiedades y entre los cuales se desea estudiar un determinado fenómeno (pueden ser hogares, número de tornillos producidos por una fábrica en un año, lanzamientos de una moneda, etc. ). Llamamos población estadística o universo al conjunto de referencia sobre el cual van a recaer las observaciones.
Muestra: es el subconjunto de la población que es estudiado y a partir de la cual se sacan conclusiones sobre las características de la población. La muestra debe ser representativa, en el sentido de que las conclusiones obtenidas deben servir para el total de la población.
Las muestras pueden ser probabilísticas o no probabilísticas. Una muestra probabilística se elige mediante reglas matemáticas, por lo que la probabilidad de selección de cada unidad es conocida de antemano. Por el contrario, una muestra no probabilística no ser rige por las reglas matemáticas de la probabilidad. De ahí que, mientras en las muestras probabilísticas es posible calcular el tamaño del error muestral, no es factible hacerlo en el caso de las muestras no probabilísticas. Ejemplos de éstas últimas son la muestra accesible (que está conformada por personas de fácil acceso para el investigador como ser colegas o alumnos de su clase.) y la muestra voluntaria (donde los sujetos de la muestra no han sido seleccionados matemáticamente)
La modalidad más elemental de muestra probabilística es la muestra aleatoria simple, en la que todos los componentes o unidades de la población tienen la misma oportunidad de ser seleccionados.
Otro procedimiento similar de muestreo aleatorio es el llamado muestreo aleatorio sistemático en el cual se escoge uno de cada x componentes del listado de la población. El investigador selecciona al azar un punto de partida y un intervalo muestral. Así si el punto de partida fuera el 11 y el intervalo el 6 se elegirían el 11, 16, 21,16 hasta completar la lista.
Siempre que se desee adecuar la representación de diferentes subconjuntos hay que recurrir a una muestra estratificada. Las características de las submuestras (estratos o segmentos) pueden contemplar casi cualquier tipo de variables: edad, sexo, religión, niel de ingresos, etc. Los estratos pueden así definirse mediante un número prácticamente ilimitado de características. Puede ser un muestreo estratificado proporcional o no proporcional.
Individuo: cada uno de los elementos de la muestra o de la población (personas, tornillos, hospitales, comercios) y sobre los que recaerá la observación.
Variable: cada uno de los rasgos o característica de los elementos de una población y que varían de un individuo a otro (salario, color de ojos, sexo, número de hijos).
Las variables pueden corresponder a cuatro niveles de medición:
1) Nominal: hace referencia a datos que sólo pueden clasificarse en categorías; existen sólo conteos; no existe orden particular para los grupos. Ejemplo: color de ojos.
2) Ordinal: corresponde a aquellos datos que se pueden agrupar en categorías y “ordenarlas” según algún tipo de gradación. Ejemplo; nivel de dolor, nivel de preferencia.
3) de Intervalo: incluye todas las características de la escala ordinal, pero además la distancia entre valores es constante pues los valores que toma este tipo de variables corresponde al orden de los números naturales. Ejemplo: número de hijos,
4) de Razón: tiene las características de la escala de intervalo, pero se agrega un punto cero absoluto tal que significa ausencia del atributo y la razón o cociente de dos números es significativo pudiéndose aplicarles todo tipo de instrumental matemático. Ejemplo: ingreso familiar.
Tipos de Variables
Las variables pueden ser cualitativas o cuantitativas. Generalmente se utiliza el término “modalidad” cuando hablamos de caracteres cualitativos y el término “valor” cuando estudiamos caracteres cuantitativos. Una variable no es sino el conjunto de las distintas modalidades o valores que toma un carácter.
Variables cualitativas (o categóricas): aquellas que no aparecen en forma numérica, sino como categorías o atributos (sexo, profesión, color de ojos). Las variables cualitativas sólo pueden ser nominales u ordinales.
Variables cuantitativas: las que pueden expresarse numéricamente (temperatura, salario, número de goles en un partido). Se pueden cuantificar los resultados experimentales por medio de instrumentos adoptando unidades de medida para valorar los diferentes resultados. Variables cuantitativas según el tipo de valores que pueda tomar pueden ser discretas o continuas. Variables discretas: son el resultado de contar y sólo toman valores enteros (número de hijos); Variables continuas: son el resultado de medir, y pueden contener decimales (temperatura, peso, altura). Se pueden subdividir a voluntad. Pueden tomar, entonces, cualquier valor de un determinado intervalo.
Distribución de Frecuencia:
En estadística existe una relación con cantidades, números agrupados o no, los cuales poseen entre sí características similares. Existen investigaciones relacionadas con los precios de los productos de la dieta diaria, la estatura y el peso de un grupo de individuos, los salarios de los empleados, los grados de temperatura del medio ambiente, las calificaciones de los estudiantes, etc., que pueden adquirir diferentes valores gracias a una unidad apropiada, que recibe el nombre de variable. La representación numérica de las variables se denomina dato estadístico.
La distribución de frecuencia es una disposición tabular de datos estadísticos, ordenados ascendente o descendentemente, con la frecuencia (ni) de cada dato. Las distribuciones de frecuencias pueden ser para datos no agrupados y para datos agrupados o de intervalos de clase.
Distribución de frecuencia para datos no Agrupados:
Es aquella distribución que indica las frecuencias con que aparecen los datos estadísticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificación al tamaño de las unidades originales. En estas distribuciones cada dato mantiene su propia identidad después que la distribución de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lógico con sus respectivas frecuencias.
Distribución de frecuencia de clase o de datos Agrupados:
Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. No existen normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el número total de datos (N) es igual o superior 50 y además el rango o recorrido de la serie de datos es mayor de 20, entonces, se utilizará la distribución de frecuencia para datos agrupados, también se utilizará este tipo de distribución cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia o la ojiva.
La razón fundamental para utilizar la distribución de frecuencia de clases es proporcionar mejor comunicación acerca del patrón establecido en los datos y facilitar la manipulación de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la información obtenida de una investigación sea manejable con mayor facilidad.
Componentes de una distribución de frecuencia de clase
1.- Rango o Amplitud total (recorrido).- Es el límite dentro del cual están comprendidos todos los valores de la serie de datos, en otras palabras, es el número de diferentes valores que toma la variable en un estudio o investigación dada. Es la diferencia entre el valor máximo de una variable y el valor mínimo que ésta toma en una investigación cualquiera. El rango es el tamaño del intervalo en el cual se ubican todos los valores que pueden tomar los diferentes datos de la serie de valores, desde el menor de ellos hasta el valor mayor estando incluidos ambos extremos. El rango de una distribución de frecuencia se designa con la letra R.
2.- Clase o Intervalo de clase.- Son divisiones o categorías en las cuales se agrupan un conjunto de datos ordenados con características comunes. En otras palabras, son fraccionamientos del rango o recorrido de la serie de valores para reunir los datos que presentan valores comprendidos entre dos limites.
Para organizar los valores de la serie de datos hay que determinar un número de clases que sea conveniente. En otras palabras, que ese número de intervalos no origine un número pequeño de clases ni muy grande. Un número de clases pequeño puede ocultar la naturaleza natural de los valores y un número muy alto puede provocar demasiados detalles como para observar alguna información de gran utilidad en la investigación.
Tamaño de los Intervalos de Clase
Los intervalos de clase pueden ser de tres tipos, según el tamaño que estos presenten en una distribución de frecuencia: a) Clases de igual tamaño, b) clases desiguales
de tamaño y c) clases abiertas.
3.-Amplitud de Clase, Longitud o Ancho de una Clase
La amplitud o longitud de una clase es el número de valores o variables que concurren a una clase determinada. La amplitud de clase se designa con las letras Ic. Existen diversos criterios para determinar la amplitud de clases, ante esa diversidad de criterios, se ha considerado que lo más importante es dar un ancho o longitud de clase a todos los intervalos de tal manera que respondan a la naturaleza de los datos y al objetivo que se persigue y esto se logra con la practica.
4.-Punto medio o Marca de clase
El centro de la clase, es el volar de los datos que se ubica en la posición central de la clase y representa todos los demás valores de esa clase. Este valor se utiliza para el calculo de la media aritmética.
5.-Frecuencia de clase o Frecuencia Absoluta
La frecuencia de clase se le denomina frecuencia absoluta y se le designa con las letras ni. Es el número total de valores de las variables que se encuentran presente en una clase determinada, de una distribución de frecuencia de clase.
como se llega a la definicion muestral?
Dependera de muchos factores, segun la definicion del problema, determinacion de objetivos, el error aceptable, etc.
Te recomiendo leas “Metodologia de la Investigacion” de HERNANDEZ SAMPIERI, R. – FERNANDEZ COLLADO, C. – LUCIO, P.
Para que una muestra posea validez técnico estadística es necesario que cumpla con los siguientes requisitos:
Þ ser representativa o reflejo general del conjunto o universo que se va a estudiar, reproduciendo de la manera más exacta posible las características de éste.
Þ que su tamaño sea estadísticamente proporcional al tamaño de la población.
Þ que el error muestral se mantenga dentro de límites aceptables
¿Cómo se calcularía el error muestral en una distribución de frecuencias de probabilidad, una vez ajustada a la distribución normal? Gracias de antemano.
jaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
no me gusta mucho la pagi esta debe ser colorida i ke tenga mas visda por ke sino entonces los,niños no le daran mucha importancia no cren ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,!!!!!!!!!!!!! y wueno en fin eso es lo yo pienso es \a mi criterio me p;parece ke deberian seguir mi consejo por oike pueda ser ke ya ………… nadie visite su pagina por ke diran esyta pagina esta a bjurridfa tiene puro texto y nada de figuras y ejemplos a mi criterio yo pienso ke los ke entrewn asu pagina los aburriria
Para Marcel
Mejor ponte a leer revistas de historietas que lo que se busca aquí es conocimiento de estadística, no divertir a los niños como tú.
NO ME GUSTA LA PAGI POR Q NO TIENE SUFICIENTE INFORMACION OKISTT:LILIANA ESPAÑA LA MEJORJAJAJAJAJAJAJAJAJAJAJAJAJAJAJAJAJAJAJAJ
COMO HALLO LA CLASE(INTERVALOS)EN UNA TABLA DE DISTRIBUCION DE FRECUENCIAS
POR FAVOR COLABORENME
pues a mi me sirvio de mucho su pagina
GRACIAS!!
exelente informacion y muy precisa