sábado, 25 de febrero de 2023

Definiciones Básicas

  La palabra estadística frecuentemente remite conceptualmente a gráficas y tablas; cifras relativas a nacimientos, muertes, impuestos, demografía, ingresos, deudas, créditos, etc. No obstante, para aprovechar las herramientas de análisis estadístico, es necesario comprender qué representa cada concepto y la metodología mediante la cual se obtiene un dato estadístico.

SU DEFINICION:

La estadística es la ciencia cuyo objetivo es reunir información cuantitativa relacionada a individuos, grupos, series de hechos, entre otros. Gracias al análisis de estos datos se pueden deducir algunos significados precisos o algunas previsiones para el futuro. La estadística, en general, es la ciencia que trata la recopilación, la organización, la presentación, el análisis y la interpretación de datos numéricos con el fin de realizar una toma de decisiones más efectiva.




Población
Conjunto de todos los elementos que permiten resolver un problema y que presentan una característica común determinada, observable y medible. Por ejemplo, si el elemento es una persona, se pueden estudiar las características edad, peso, nacionalidad, sexo, etc. Los elementos que integran una población pueden corresponder a personas, objetos o grupos (por ejemplo, familias, las manzanas de una cosecha, empleados de una empresa, etc.).

Muestra
Cuando es difícil estudiar la población debido a su gran tamaño o que provenga de un proceso que no se detiene (como la producción de un bien), se debe analizar un subconjunto o parte de ésta que la represente, llamado muestra, partiendo del supuesto de que este subconjunto presenta el mismo comportamiento y características que la población. En general, el tamaño de la muestra es mucho menor al tamaño de la población. Por ejemplo, a veces se estudian poblaciones enteras: elecciones, censos; otra veces números “pequeños”: los alumnos de una facultad, los habitantes de una ciudad, los miembros de una asociación, etc.; pero otras muchas veces se estudian muestras.

Individuo
Un individuo o unidad estadística es cada uno de los elementos que componen la población. Debes tener en cuenta que un individuo en estadística puede ser distinto a un individuo como persona. Por ejemplo, en los censos económicos se obtienen datos de los negocios. En este caso cada negocio, que está formado por varias personas, es un individuo de la población. 

Muestreo
Es el proceso de recabar los datos que se desean analizar, obtenidos de una proporción reducida y representativa de la población. 

Dato
El dato es cada uno de los valores que se han obtenido al realizar un estudio estadístico. Por ejemplo: si se lanza una moneda al aire 5 veces obtenemos 5 datos: sol, sol, águila, sol, águila. 

Variable
Se llama variable a una característica que se observa en una población o muestra, la cual se desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo y se puede clasificar en cuantitativa y cualitativa.

probabilidad

 DEFINICIONES DE PROBABILIDAD:



 DEFINICION FRECUENCIAL DE PROBABILIDAD En el punto se han definido las características de un experimento aleatorio. Un ejemplo de experiencia aleatoria es el lanzamiento de una moneda. Cuando se lanza una moneda al aire sólo hay dos resultados posibles, cara o cruz. El resultado no se puede predecir de antemano y variará cuando se lance en forma repetida, sin embargo se observa una cierta regularidad en los resultados, una regularidad que sólo emerge después de muchas repeticiones. La figura 3.1 muestra la regularidad observada al lanzar una moneda 1000 veces. Para cada lanzamiento, desde el primero hasta el último, se ha representado la proporción de lanzamientos que han dado “cara” hasta ese momento. El primer lanzamiento fue cara, por tanto, la proporción de caras empieza siendo 1. El segundo lanzamiento fue cruz. Después de los dos lanzamientos, la proporción de caras se ha reducido a 0.5. Los siguientes tres lanzamientos dieron una cruz seguida de dos caras, por consiguiente, la proporción de caras después de cinco lanzamientos es 3/5 ó 0,6. La proporción de lanzamientos que dan cara es bastante variable al principio, pero posteriormente se estabiliza a medida que se hacen más y más lanzamientos. Llega un momento en que esta proporción se acerca a 0,5 y se mantiene en ese valor. Se dice que 0,5 es la probabilidad de que salga cara. Una probabilidad de 0,5 significa que el suceso cara “ocurre la mitad de las veces después de muchos lanzamientos”. En otras palabras, se puede decir que si se arrojara un gran número de veces esa moneda al aire, aproximadamente el 50 % de las veces se observaría el resultado cara o expresándolo en los términos anteriormente vistos, la frecuencia relativa del suceso cara sería aproximadamente 0,5.





G.Carnevalli-E.Franchelli-G.Gervasoni, (SF) probabilidad.


Espacio muestral y sucesos 

En una experiencia aleatoria cada resultado se conoce con el nombre de suceso. 

Se llama suceso elemental a todo resultado simple. Por ejemplo, si se considera la experiencia aleatoria de tirar un dado, cada uno de los resultados: 1, 2, 3, 4, 5 y 6 son sucesos elementales.

Al conjunto de todos los sucesos elementales posibles se lo llama espacio muestral (S) En el ejemplo S = {1, 2 , 3 , 4 , 5 , 6 } Simbólicamente: S = {s1, s2, s3..... } El espacio muestral puede ser finito o infinito, numérico o no numérico 

Un suceso que no puede ocurrir ante una repetición de la experiencia aleatoria es un suceso imposible. Se lo suele indicar ∅.

Distribución uniforme discreta

 Distribución uniforme discreta 

 Decimos que una variable aleatoria discreta (X) tiene distribución uniforme cuando la probabilidad en todos los puntos de masa probabilística es la misma; es decir, cuando todos los posibles valores que puede adoptar la variable (x1, x2,...,xk) tienen la misma probabilidad. Pongamos el socorrido pero útil caso del lanzamiento de un dado. Si definimos una variable aleatoria (X) como el número resultante tras su lanzamiento, los valores que puede tomar esa variable aleatoria son {1, 2, 3, 4, 5, 6}. Pues bien, esa variable aleatoria tiene distribución uniforme si, como es el caso, la probabilidad es la misma para cada uno de los resultados posibles.



estadística l videoconferencias

 Ver "Esta I-s3" | Microsoft Stream (Clásico)

Romero B. (2023) estadística l , universidad aliat


video contenido

Ver "Est 2023S2" | Microsoft Stream (Clásico)

Romero B. (2023) estadística l , universidad aliat


viernes, 24 de febrero de 2023

Media, mediana, modo y rango

Media 

Utilice la media para describir un conjunto entero de observaciones con un solo valor que representa el centro de los datos. Muchos análisis estadísticos utilizan la media como un punto de referencia estándar. La media es la suma de todas las observaciones dividida entre el número de observaciones. 

Por ejemplo, el tiempo de espera (en minutos) de cinco clientes de un banco es: 3, 2, 4, 1 y 2. El tiempo medio de espera es:

3+2+4+1+2      12
------------- :      --- :   2.4 min
       5                  5

En promedio, un cliente espera 2.4 minutos para ser atendido en el banco.


Mediana 

Utilice la mediana para describir un conjunto entero de observaciones con un solo valor que representa el centro de los datos. La mitad de las observaciones está por encima de la mediana y la otra mitad está por debajo de ésta. Se determina al jerarquizar los datos y hallar el número de observación [N + 1] / 2. Si hay un número par de observaciones, la mediana se extrapola como el valor que está justo en el medio entre el valor de las observaciones N / 2 y [N / 2] + 1.

7-9-10-12-13-14-17-18-19

Para estos datos ordenados, la mediana es 13. Es decir, el 50% de los valores es menor que o igual a 13 y el 50% de los valores es mayor que o igual a 13


Moda 

La moda es el valor que ocurre con más frecuencia en un conjunto de observaciones. Minitab también muestra cuántos puntos de los datos son iguales a la moda. La moda se puede utilizar con la media y la mediana para proporcionar una caracterización general de la distribución de los datos. Mientras que la media y la mediana requieren un cálculo, la moda se obtiene simplemente contando el número de veces que cada valor ocurre en un conjunto de datos. El identificar la moda puede ayudar a comprender la distribución. 
 
2-2-4-4-4-5-7-8-8-8-8-8-9-0

Unimodal Solo hay una moda, 8, que ocurre con más frecuencia.

2-2-4-4-4-4-7-8-8-8-9-9-16-16-16-16

Bimodal Hay dos modas, 4 y 16. Los datos parecen representar 2 poblaciones diferentes.

Rango

mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo.

Rango = valor más pequeño – valor más grande 

52 – 32 = 20 Resta el más pequeño del más grande. El rango es 20 puntos. Para este grupo de datos, solo hay dos medidas de promedio (no hay moda). Tanto la media como la mediana podrían usarse para describir el promedio.



caja y bigotes

 Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero(recordemos que el segundo cuartil coincide con la mediana). Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente

Utilizamos la ya usada distribución de frecuencias (en tallos y hojas), que representan la edad de un colectivo de 20 personas.

36 25 37 24 39 20 36 45 31 31

39 24 29 23 41 40 33 24 34 40

Ordenar los datos 

Para calcular los parámetros estadístico, lo primero es ordenar la distribución 20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45 Calculo de Cuartiles 

Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente: Q1=(24 + 25) / 2 = 24,5

Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media aritmética de dicho valor y el siguiente: me= Q2 = (33 + 34)/ 2 =33,5 

Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En nuestro caso, como 3N / 4 = 15, resulta Q2=(39 + 39) / 2 = 39