jueves, 25 de junio de 2015

1._ESTADÍSTICAS

ESTADISTICA

La estadística es una ciencia formal y una herramienta que estudia el uso y los análisis provenientes de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional.
Sin embargo, la estadística es más que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado con la investigación científica.
Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad.
Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales.
La estadística se divide en dos grandes áreas:
1.   Estadística descriptiva: Se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos deparámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histogramapirámide poblacionalgráfico circular, entre otros.
2.   Estadística inferencial: Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedadde las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas sí/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen análisis de varianzaseries de tiempo y minería de datos.
La palabra «estadísticas» también se refiere al resultado de aplicar un algoritmo estadístico a un conjunto de datos, como en estadísticas económicasestadísticas criminales, entre otros.
                                    EJEMPLOS:
- Los censos de población: ( % de hombres y % de mujeres, tantos de tal edad, etc) 

- Las estadísticas electorales: ( % para tal partido, % para el otro) 



- Las comparativas:( En tal año se produjo x cantidad de petroleo, hoy se produce x1) 

1.1_ Manejo de la información

"El manejo de información es un proceso que exige informarse e informar. Es decir, exige construir, primero, una representación de una determinada realidad con los datos que adquirimos de ella para poder darla a conocer, disponiendo esa representación al alcance de los demás o comunicarla."
CUANDO HABLAMOS DE EL MANEJO DE LA INFORMACION, PODEMOS AGRAGAR LAS CARACTERISTICAS DE LAS MISMAS. Es un proceso dinámico: porque está en continuo movimiento, inevitable: porque se requiere para la transmisión de significados, irreversible: porque una vez realizada, no puede regresar, borrarse o ignorarse. Bidireccional: porque existe una respuesta en ambas direcciones. Verbal y no verbal: porque implica la utilización de ambos lenguajes.
A continuación se enumerará el proceso de dicho manejo.


MANEJO DE LA INFORMCAION

1* Búsqueda de información

La búsqueda de información es la identificación y localización de material que se adapte a sus necesidades de información que se debe utilizar una amplia variedad de fuentes. Es una investigación que se realiza para extraer dicho conocimiento de cierto tema propuesto.

2* Selección de información

La selección de la información es determinar cierta cantidad de datos relevantes de un conjunto.
Las preguntas que se deben de hacer para la selección de la información es la siguiente:
*¿Cómo saber cuál es la mejor información para el propósito educativo que se persigue?
*¿Es suficiente saber usar los buscadores para disponer de la mejor información?
*¿Cómo selecciono la información apropiada a las características de mis estudiantes y a la naturaleza de la actividad?

3* Validación de información

La validación de la información es el proceso de confirmar la indagación con la argumentación que plantean. Para evaluar la credibilidad o fiabilidad de los documentos se pueden tener en cuenta y valorar cinco aspectos:
*Autoría
*Actualidad
*Contenido
*Propósitos y destinatarios
*Aspectos técnicos y visuales de la página

4* Orden de información

El orden de información es la forma coordinada y regular de funcionar a desarrollarse la investigación coherente y lógicamente, aporta como uno de sus resultados principales un esquema o bosquejo general. En esta etapa se desglosan las ideas; se identifica la tesis o hipótesis, se elige el material de apoyo, el tipo de párrafos el tipo de introducción y conclusión que se empleará. La estructura constituye la columna vertebral del escrito, los párrafos irán estructurándose de acuerdo con el tipo de texto que se haya elegido. No necesariamente se tiene que limitar a uno solo, pueden combinarse de acuerdo conel tema y el propósito con el que se escribe.
Organización de la Información: Definición del orden.
Una vez definida la tesis, las ideas principales y las secundarias, es necesario definir el orden en que se va a presentar la información, la cual puede ser:
*Cronológico: Este tipo de organización es efectiva cuando se narran experiencias personales, cuando se resumen los pasos de algo, o se explica un evento. Los detalles se organizan en el orden en que ocurrieron.
*Espacial: Es usado en muchos tipos de descripciones, ayuda mucho para dar unidad al escrito, permite arreglar los detalles de derecha a izquierda de arriba a abajo, de lejos a cerca etc.
*De grado de dificultad: El texto sigue una secuencia de lo simple a lo complejo o viceversa.

5* Recuperación de información


El proceso de recuperación se lleva a cabo mediante consultas a la base de datos donde se almacena la información estructurada, mediante un lenguaje de interrogación adecuado. Es necesario tener en cuenta los elementos clave que permiten hacer la búsqueda, determinando un mayor grado de pertinencia y precisión, como son: los índices, palabras clave, tesauros y los fenómenos que se pueden dar en el proceso como son el ruido y silencio documental. Uno de los problemas que surgen en la búsqueda de información es si lo que recuperamos es "mucho o poco" es decir, dependiendo del tipo de búsqueda se pueden recuperar multitud de documentos o simplemente un número muy reducido. A este fenómeno se denomina silencio o ruido documental.

1.2_Muestreo

 MUESTREO

estadística se conoce como muestreo a la técnica para la selección de una muestra a partir de una población.
Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean extra a la población. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzarían si se realizase un estudio de toda la población.
Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio adecuado (que consienta no solo hacer estimaciones de la población sino estimar también los márgenes de error correspondientes a dichas estimaciones), debe cumplir ciertos requisitos. Nunca podremos estar enteramente seguros de que el resultado sea una muestra representativa, pero sí podemos actuar de manera que esta condición se alcance con una probabilidad alta.
En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se puede extraer dos o más muestras de la misma población. Al conjunto de muestras que se pueden obtener de la población se denomina espacio muestra. La variable que asocia a cada muestra su probabilidad de extracción, sigue la llamada distribución muestra.

Técnicas de muestreo estadístico

Existen dos métodos para seleccionar muestras de poblaciones: el muestreo no aleatorio o de juicio y el muestreo aleatorio (que incorpora el azar como recurso en el proceso de selección). Cuando este último cumple con la condición de que todos los elementos de la población tienen alguna oportunidad de ser escogidos en la muestra, si la probabilidad correspondiente a cada sujeto de la población es conocida de antemano, recibe el nombre de muestreo probabilístico. Una muestra seleccionada por muestreo de juicio puede basarse en la experiencia de alguien con la población. Algunas veces una muestra de juicio se usa como guía o muestra tentativa para decidir cómo tomar una muestra aleatoria más adelante.






1.3_ Frecuencia

Tipos de frecuencia
Frecuencia absoluta: Es el promedio de una suma predeterminada y además consiste en saber cual es 
FRECUENCIA

el número o símbolo de mayor equivalencia. (ni) de una variable estadística Xi, es el número de veces que este valor aparece en el estudio. A mayor tamaño de la muestra aumentará el tamaño de la frecuencia absoluta; es decir, la suma total de todas las frecuencias absolutas debe dar el total de la muestra estudiada (N).En estadística se pueden distinguir hasta cuatro tipos de frecuencias:

  • Frecuencia relativa (fi), es el cociente entre la frecuencia absoluta y el tamaño de la muestra (N). Es decir,
f_i = \frac{n_i}{N} = \frac{n_i}{\sum_i n_i}
siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una distribución de frecuencias.
Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por ciento (pi)
·         Frecuencia absoluta acumulada (Ni), es el número de veces ni en la muestra N.
·         Frecuencia relativa acumulada (Fi), es el cociente entre la frecuencia absoluta acumulada y el total de la muestra.
F_i = \frac{N_i}{N}
Ejemplos de frecuencias
Supongamos que las calificaciones de un alumno de secundaria fueran las siguientes:
18, 13, 12, 14, 11, 08, 12, 15, 05, 20, 18, 14, 15, 11, 10, 10, 11, 13. Entonces:
·         La frecuencia absoluta de 11 es 3, pues 11 aparece 3 veces.
·         La frecuencia relativa de 11 es 0.17, porque corresponde a la división 3/18 ( 3 de las veces que aparece de las 18 notas que aparecen en total).



1.4_Distribución de Frecuencia


DISTRIBUCIÓN DE FRECUENCIAS



En estadística, los datos se organizan en distribuciones. En una distribución de frecuencias, las observaciones se clasifican de acuerdo a categorías de valores. En otras palabras, una distribución de frecuencias nos indica cuántas veces se observó cada categoría. En otras palabras, una distribución proporciona datos sobre el número de observaciones que corresponde a cada categoría. En el caso de las variables discretas, esto es más intuitivo, pero también se aplica a las variables continuas. El siguiente ejemplo nos ayudará a ilustrar el concepto.
En el Cuadro 3 se muestra un ejemplo de la distribución de frecuencias de las matrículas primarias en Balochistán, Pakistán, clasificadas según la variable “género”. Las categorías del ejemplo son “niños” y “niñas”. El “género” de los estudiantes (femenino o masculino) es una variable discreta. Los individuos observados simple y naturalmente pertenecen a uno u otro género. Así, el procedimiento para clasificar según el género es simple y directo. El género, como todas las variables discretas, dispone naturalmente de sus categorías.
Cuadro 3. Distribución de matrículas primarias por género en Balochistán, Pakistán.
Género
Total matriculado (1998)
Niños
315.111
Niñas
80.260
En la Figura 11 se muestra la misma distribución de frecuencias en forma de gráfico o “histograma”. Un “histograma” es simplemente el nombre que los estadísticos dan a un gráfico que representa una distribución de frecuencia.
https://blogger.googleusercontent.com/img/proxy/AVvXsEj9JDykcddf3cGZMlhrJO1xf6vsjIDPMtCig7-881XEDzOEtEiu5uqCpFuFUMEAQ7nJi_HsQ5XWvBJmBlOy39N51kmuFsRf-4NY3rvnWZR0KxrRdMvb98r-lb8SGvx2RMYvbo1iyH4SBc02BDCLqBjgN8zAXCHvFSB3E7dN1F0T6s-4=




Representación gráfica, expresión gráfica o dibujo son conceptos que se entienden como un lenguaje propio, a la vez que básico, de diferentes técnicos relacionados con la ingeniería o la arquitectura, uno puede expresarse gráficamente desde el arte o desde la técnica; en cualquier caso, , el objetivo de las representaciones técnicas es “definir, mediante el lenguaje gráfico, una realidad espacial de manera exhaustiva, no ambigua y no contradictoria”¹.
  • Una gráfica es la representación en unos ejes de coordenadas de los pares ordenados de una tabla.


Las gráficas describen relaciones entre dos variables.

La variable que se representa en el eje horizontal se llama variable independiente o variable x.
La que se representa en el eje vertical se llama variable dependiente o variable y.
La variable y está en función de la variable x.
Una vez realizada la gráfica podemos estudiarla, analizarla y extraer conclusiones.
Para interpretar una gráfica, hemos de observarla de izquierda a derecha, analizando cómo varía la variable dependiente, y, al aumentar la variable independiente, x.

Kg de patatas
1
2
3
4
5
Precio en €
2
4
6
8
10
gráfica

En esa gráfica podemos observar que a medida que compramos más kilos de patatas el precio se va incrementando.

Nota
0
1
2
3
4
5
6
7
8
9
10
Nº de alumnos
1
1
2
3
6
11
12
7
4
2
1

1.5_ Representación Gráfica

En estadística, los datos se organizan en distribuciones. En una distribución de frecuencias, las observaciones se clasifican de acuerdo a categorías de valores. En otras palabras, una distribución de frecuencias nos indica cuántas veces se observó cada categoría. En otras palabras, una distribución proporciona datos sobre el número de observaciones que corresponde a cada categoría. En el caso de las variables discretas, esto es más intuitivo, pero también se aplica a las variables continuas. El siguiente ejemplo nos ayudará a ilustrar el concepto.
En el Cuadro 3 se muestra un ejemplo de la distribución de frecuencias de las matrículas primarias en Balochistán, Pakistán, clasificadas según la variable “género”. Las categorías del ejemplo son “niños” y “niñas”. El “género” de los estudiantes (femenino o masculino) es una variable discreta. Los individuos observados simple y naturalmente pertenecen a uno u otro género. Así, el procedimiento para clasificar según el género es simple y directo. El género, como todas las variables discretas, dispone naturalmente de sus categorías.
Cuadro 3. Distribución de matrículas primarias por género en Balochistán, Pakistán.
Género
Total matriculado (1998)
Niños
315.111
Niñas
80.260
En la Figura 11 se muestra la misma distribución de frecuencias en forma de gráfico o “histograma”. Un “histograma” es simplemente el nombre que los estadísticos dan a un gráfico que representa una distribución de frecuencia.
https://blogger.googleusercontent.com/img/proxy/AVvXsEj9JDykcddf3cGZMlhrJO1xf6vsjIDPMtCig7-881XEDzOEtEiu5uqCpFuFUMEAQ7nJi_HsQ5XWvBJmBlOy39N51kmuFsRf-4NY3rvnWZR0KxrRdMvb98r-lb8SGvx2RMYvbo1iyH4SBc02BDCLqBjgN8zAXCHvFSB3E7dN1F0T6s-4=




Representación gráfica, expresión gráfica o dibujo son conceptos que se entienden como un lenguaje propio, a la vez que básico, de diferentes técnicos relacionados con la ingeniería o la arquitectura, uno puede expresarse gráficamente desde el arte o desde la técnica; en cualquier caso, , el objetivo de las representaciones técnicas es “definir, mediante el lenguaje gráfico, una realidad espacial de manera exhaustiva, no ambigua y no contradictoria”¹.
  • Una gráfica es la representación en unos ejes de coordenadas de los pares ordenados de una tabla.
  • Las gráficas describen relaciones entre dos variables.
  • La variable que se representa en el eje horizontal se llama variable independiente o variable x.
  • La que se representa en el eje vertical se llama variable dependiente o variable y.
  • La variable y está en función de la variable x.
  • Una vez realizada la gráfica podemos estudiarla, analizarla y extraer conclusiones.
  • Para interpretar una gráfica, hemos de observarla de izquierda a derecha, analizando cómo varía la variable dependiente, y, al aumentar la variable independiente, x.

Kg de patatas
1
2
3
4
5
Precio en €
2
4
6
8
10
gráfica

En esa gráfica podemos observar que a medida que compramos más kilos de patatas el precio se va incrementando.
Nota
0
1
2
3
4
5
6
7
8
9
10
Nº de alumnos
1
1
2
3
6
11
12
7
4
2
1
gráfica



2._ MEDIDAS DE TENDENCIA

MEDIDAS DE TENDENCIAS 


Las medidas de tendencia  son valores que se ubican al centro de un conjunto de datos ordenados según su magnitud. Generalmente se utilizan 4 de estos valores también conocidos como estadígrafos, la media aritmética, la mediana, la moda y al rango medio. 

La media aritmética es la medida de posición utilizada con más frecuencia. Si se tienen n valores de observaciones, la media aritmética es la suma de todos y caca uno de los valores dividida entre el total de valores: Lo que indica que puede ser afectada por los valores extremos, por lo que puede dar una imagen distorsionada de la información de los datos.

La Mediana, es el valor que ocupa la posición central en un conjunto de datos, que deben estar ordenados, de esta manera la mitad de las observaciones es menor que la mediana y la otra mitad es mayor que la mediana, resulta muy apropiada cuando se poseen observaciones extremas. 



La Moda es el valor de un conjunto de datos que aparece con mayor frecuencia. No depende de valores extremos, pero es más variables que la media y la mediana.


La medidas de centralización nos indican en torno a qué valor (centro) se distribuyen los datos.
La medidas de centralización son:
Moda
Cálculo de la moda para datos agrupados
1º Todos los intervalos tienen la misma amplitud.
Ejemplo
fi
[60, 63)5
[63, 66)18
[66, 69)42
[69, 72)27
[72, 75)8
100
2º Los intervalos tienen amplitudes distintas.
Ejemplo
fihi
[0, 5)153
[5, 7)2010
[7, 9)126
[9, 10)33
50
Mediana
Cálculo de la mediana
Cálculo de la mediana para datos agrupados
Ejemplo
fiFi
[60, 63)55
[63, 66)1823
[66, 69)4265
[69, 72)2792
[72, 75)8100
100
Media aritmética
Ejemplo
Media aritmética para datos agrupados
Ejercicio de media aritmética
xifixi · fi
[10, 20)15115
[20, 30)258200
[30,40)3510350
[40, 50)459405
[50, 60558440
[60,70)654260
[70, 80)752150
421 820
Propiedades de la media aritmética
Observaciones sobre la media aritmética
xifi
[60, 63)61.55
[63, 66)64.518
[66, 69)67.542
[69, 72)70.527
[72, ∞ )8
100
La moda es el valor que tiene mayor frecuencia absoluta.
Se representa por Mo.
Se puede hallar la moda para variables cualitativas ycuantitativas.
Hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8Mo = 4


fórmula de la moda
Li es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la en clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:
moda
Calcular la moda de una distribución estadística que viene dada por la siguiente tabla:
moda
moda


En primer lugar tenemos que hallar las alturas.
alturas
La clase modal es la que tiene mayor altura.
moda


La fórmula de la moda aproximada cuando existen distintas amplitudes es:
moda
En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la moda.
moda
moda


Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar sólo para variables cuantitativas.
Ordenamos los datos de menor a mayor.
Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5
Si la serie tiene un número par de puntuaciones la mediana es la media entre las dospuntuaciones centrales.
7, 8, 9, 10, 11, 12Me= 9.5
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre cociente.
mediana
Li es el límite inferior de la clase donde se encuentra la mediana.
cociente es la semisuma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
La mediana es independiente de las amplitudes de los intervalos.
Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:
100 / 2 = 50
Clase modal: [66, 69)
mediana


La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre elnúmero total de datos.
símbolo de la media aritmética es el símbolo de la media aritmética.
fórmula de la media
media
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
media aritmética


Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:
media
media
En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuación media.
media


La suma de las desviaciones de todas las puntuaciones de una distribución respecto a la mediade la misma igual a cero.
expresión
Las suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética 7.6 es igual a 0:
8 − 7.6 + 3 − 7.6 + 5 − 7.6 + 12 − 7.6 + 10 − 7.6 =
= 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0
La media aritmética de los cuadrados de las desviaciones de los valores de la variable con respecto a un número cualquiera se hace mínima cuando dicho número coincide con la media aritmética.
mínimo
Si a todos los valores de la variable se les suma un mismo número, la media aritméticaqueda aumentada en dicho número.
Si todos los valores de la variable se multiplican por un mismo número la media aritméticaqueda multiplicada por dicho número.


La media se puede hallar sólo para variables cuantitativas.
La media es independiente de las amplitudes de los intervalos.
La media es muy sensible a las puntuaciones extremas. Si tenemos una distribución con los siguientes pesos:
65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.
La media es igual a 74 kg, que es una medida de centralización poco representativa de la distribución.
La media no se puede calcular si hay un intervalo con una amplitud indeterminada.

En este caso no es posible hallar la media porque no podemos calcular la marca de clase de último intervalo.