viernes, 16 de octubre de 2015

Diagramas

Diagramas estadísticos

En estadística

La ojiva es el polígono frecuencial acumulado, es decir, que permite ver cuántas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de solo exhibir los números asignados a cada intervalo
La ojiva apropiada para información que presente frecuencias mayores que el dato que se está comparando tendrá una pendiente negativa (hacia abajo y a la derecha) y en cambio la que se asigna a valores menores, tendrá una pendiente positiva. Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar parcialmente la misma técnica a una distribución acumulativa y de igual manera que éstas, existen las ojivas mayor que y las ojivas menor que.
Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias (y por esto la aplicación de la técnica es parcial):
Un extremo de la ojiva no se toca al eje horizontal, para la ojiva "mayor que" sucede con el extremo izquierdo; para la ojiva "menor que", con el derecho.
En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase. Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor.
La ojiva "mayor que" se le denomina de esta manera porque viendo el punto que está sobre el limite superior se ven las frecuencias que tienen por encima de ese limite superior. De forma análoga, en la ojiva "menor que" la frecuencia que se representa en cada frontera de clase son el número de observaciones menores que la frontera señalada (en caso de tiempos sería el número de observaciones antes de la hora que señala la frontera)1 .







 pirámide de población o pirámide demográfica es un histograma que está hecho a base de barras cuya altura es proporcional a la cantidad que representa la estructura de la población por sexo y edad que se llaman cohortes.
Pirámide de población de Chile 2008.
Gráficamente se trata de un doble histograma de frecuencias. Las barras del doble histograma se disponen en forma horizontal, es decir, sobre la línea de las abscisas, y convencionalmente se indican los grupos de edad de la población masculina a la izquierda y los que representan la población femenina a la derecha. A su vez, en el eje de las ordenadas se disponen e identifican los grupos de edad, por lo general, de cuatro en cuatro años (0 a 4, 5 a 9, 10 a 14, etc.), colocando las barras de menor edad en la parte inferior del gráfico y aumentando progresivamente hacia la cúspide las edades de cada intervalo.
Cuando existe una información detallada (nacimientos y defunciones anuales) podemos elaborar una pirámide de población también con esa información detallada (barras de año en año). La escala de las abscisas puede representar valores absolutos (es decir, número de habitantes de cada grupo de edad y sexo), como sucede en la que corresponde a los datos de Angola, o relativos, es decir, porcentajes de cada grupo de edad y sexo con relación a la población total, como en la pirámide de población de Francia.
La ventaja de mostrar los datos relativamente es que podríamos comparar dos pirámides de población diferentes, ya que se basan en porcentajes o valores relativos.
Este tipo de gráfico toma su nombre de la forma que adopta en las sociedades que tienen una población con una amplia base debido al gran número de nacimientos y que se estrecha paulatinamente por la mortalidad creciente y acumulativa a medida que aumenta la edad de la población.

Características demográficas de la población

Las características biológicas e inamovibles de la especie humana crean unas ligeras diferencias en cuanto a la población según el sexo y a la variación de dichas diferencias a través de las distintas edades:
  • Nacen más varones que mujeres. Este hecho es general y se puede ver en los datos demográficos de cualquier país del mundo. Sin embargo, la diferencia es relativamente pequeña (menos del 1% , aproximadamente) aunque consistente. Como resultado de este hecho, las barras de la base en una pirámide de edades son siempre mayores en la población masculina (salvo en poblaciones muy reducidas en casos muy especiales). Por ejemplo, la población masculina menor de los 5 años de edad en Venezuela (según el censo de 2001) era del 5,49 % mientras que la femenina era del 5,22, porcentajes obtenidos con respecto a la población total y no como se señala en los datos oficiales del Censo, es decir, con respecto a la población masculina o femenina solamente.1
  • La mortalidad femenina siempre es menor que la infantil en todas las edades, especialmente en los primeros tiempos de vida, tanto en lo que respecta a la mortalidad neonatal como a la infantil (menores de un año de edad). Como consecuencia de ello, en una pirámide de edades y sexo de un país con poca incidencia de las migraciones, la amplitud de las barras tiende a hacerse similar a medida que ascendemos con las edades llegando a un momento a partir del cual comienzan a ser más amplias las barras de la población femenina.
  • La esperanza de vida siempre es mayor en las mujeres en varios años, dependiendo en gran parte del nivel de desarrollo socio-económico del país. Esta característica de la especie humana explica en su mayor parte la gran diferencia existente entre las edades más avanzadas que se ha indicado arriba. Ejemplo: la población venezolana mayor de 60 años en el Censo de 2001 era de 716.555 hombres y 839.307 mujeres.2

Tipos de pirámide de población

Como se ha visto, los datos que sirven para la elaboración de las pirámides pueden ser absolutos y relativos. Los relativos son más apropiados cuando nos interesa comparar la composición de la población de distintos países y los datos porcentuales de cada grupo de edad y sexo deben establecerse de acuerdo a la población total y no de acuerdo a la población total de cada sexo (como se ha hecho en algunos países) porque esta información no presenta ninguna utilidad. Los datos absolutos se pueden transformar en relativos mediante un regla de tres: la población total (en cifras absolutas) es a 100 como la población de cada grupo de edad y sexo es a x. Entonces se multiplica la población masculina o femenina de cada grupo de edad por 100 y el resultado se divide entre la población total.

De acuerdo a su forma

Fotografía de 1909 de una fiesta en una oficina salitrera. Reflejo de una pirámide progresiva en un entorno laboral con mayoría de hombres
Los distintos tipos de pirámides de población son: progresiva de base ancha y cima pequeña, regresiva de base más estrecha que el centro y cima relativamente ancha, y estacionaria, cuando existe una desproporción tanto en lo que respecta a la composición según sexo, como en lo que respecta a las edades y casi siempre se produce una combinación de las dos posibilidades. En la pirámide de los Emiratos Árabes Unidos puede verse fácilmente ese desequilibrio debido a la fuerte inmigración de varones jóvenes en edad de trabajar en la explotación de los recursos petroleros o en la construcción. Por el contrario, las barras correspondientes a las mujeres de todas las edades y a los niños de los dos sexos, están muy reducidas. Este caso no es el único tipo de desequilibrios que puede producirse y existe otro en el que el desequilibrio es casi el opuesto al que aquí se indica: es el que a una población que acaba de atravesar una guerra, el número de varones jóvenes es muy escaso y el de las mujeres y niños es mucho mayor. Es el caso de Alemania después de la segunda guerra mundial y en otros casos.
Ejemplo de pirámide de una población en rápido crecimiento (Angola)
Ejemplo de pirámide de una población en fase de envejecimiento (Francia). La pirámide registra también el incremento en la natalidad en el período posterior a la conclusión de la segunda guerra mundial ("escalón" superior 60-64 años)
Ejemplo de pirámide de una población desequilibrada a causa por ejemplo de una inmigración masiva de trabajadores hombres (Emiratos Árabes Unidos)
Los distintos tipos de pirámides de población tienen a escala local o regional, variaciones bastante notables, lo que se debe a las distintas composiciones demográficas de la población según sean las características geográficas del área:
  • En primer lugar, las poblaciones rurales tienen una natalidad superior a las áreas urbanas, sobre todo si, en estas últimas, se trata de ciudades bastante grandes. Los motivos de esta característica se deben a las diferencias sociológicas, laborales y de posibilidades económicas y educativas, que existen entre las áreas rurales y urbanas. Por ejemplo, en el medio rural, el trabajo de niñas y niños de corta edad es una constante casi desde el principio de la humanidad, lo cual se debe a que muy temprano comienzan a ayudar a sus padres (los niños) y a las madres (las niñas) en lo que se refiere a pequeñas tareas o quehaceres agrícolas o domésticos. A su vez, esta característica tan arraigada entre las poblaciones rurales de todo el mundo, tanto si se trata de países subdesarrollados como de países desarrollados, hace que la ausencia escolar y, sobre todo, la deserción escolar estacional o permanente, sean mucho más intensas en el medio rural. Como consecuencia de ello, la población rural es más joven y tiene un predominio del sexo masculino, especialmente en las áreas más subdesarrolladas, ya que en ellas, el éxodo rural es mucho más importante entre el sexo femenino que en el masculino, por la mayor diversidad de actividades económicas y educativas que existe para las mujeres en las ciudades. Por el contrario, la natalidad en las ciudades es mucho menor que en el campo por las menores necesidades de trabajo infantil, la dificultad en satisfacer las necesidades sociales, educativas, culturales, médicas y recreativas (entre otras) de una población infantil siempre creciente, no tanto por la natalidad, sino por la inmigración de personas jóvenes en edad de trabajar y también de tener hijos, lo cual es el motivo que explica el por qué los inmigrantes suelen tener un índice de natalidad superior al de la población autóctona y también el congestionamiento y espacio reducido de las viviendas y muchos otros factores.
  • En segundo lugar, en la población como consecuencia de lo dicho anteriormente, predomina el sexo femenino y el grupo de población adulta, siendo a menudo el de población vieja casi tan numeroso, o más, que el de la población joven.
  • En tercer lugar, en las áreas rurales, el efecto de la emigración se deja sentir en el grupo de los adultos jóvenes (20 a 30 años, aproximadamente), por la fuerte emigración hacia las ciudades o éxodo rural. La escasez de población activa en el campo se suele corregir mediante un creciente empleo de técnicas modernas de cultivo (por ejemplo, riego por goteo o empleo de motocultores eficientes y cada vez mayores), o con la contratación de inmigrantes con salarios más bajos, lo cual viene a afectar la calidad del empleo y, por ende, el aumento del éxodo rural.
  • Por último, la diversidad geográfica que se ha expresado arriba, y que afecta a todo el mundo (aunque con diferencias notables entre el mundo desarrollado y el subdesarrollado) tiende a crear, con el tiempo, ciertos mecanismos de compensación.












En estadística, tales como muestras estratificadas, un valor atípico (en inglés outlier) es una observación que es numéricamente distante del resto de los datos. Las estadísticas derivadas de los conjuntos de datos que incluyen valores atípicos serán frecuentemente engañosas. Por ejemplo, en el cálculo de la temperatura media de 10 objetos en una habitación, si la mayoría tienen entre 20 y 25 ºC, pero hay un horno a 350 °C, la mediana de los datos puede ser 23, pero la temperatura media será 55. En este caso, la mediana refleja mejor la temperatura de la muestra al azar de un objeto que la media. Los valores atípicos pueden ser indicativos de datos que pertenecen a una población diferente del resto de la muestra establecida.
Tomando como referencia la diferencia entre el primer cuartil (Q_1) y el tercer cuartil Q_3, o valor intercuartil, en un diagrama de caja se considera un valor atípico el que se encuentra 1,5 veces esa distancia de uno de esos cuartiles (atípico leve) o a 3 veces esa distancia (atípico extremo).

Valor atípico leve

Siendo Q_1 y Q_3 el primer y tercer cuartil, y IQR el rango intercuartil (Q_3-Q_1), un valor atípico leve será aquel que:
< Q_1 - 1.5\cdot \mathrm{IQR},
o
> Q_3 + 1.5\cdot \mathrm{IQR}.
Q_1 y Q_3 determinan, pues, los llamados limites interiores, a partir de los cuales la observación se considera un atípico leve.

Valor atípico extremo

Los atípicos extremos son observaciones más allá de los límites externos:
< Q_1 - 3\cdot \mathrm{IQR},
o
> Q_3 + 3\cdot \mathrm{IQR}.














 variograma o semivariograma es una herramienta que permite analizar el comportamiento espacial de una variable sobre un área definida, obteniendo como resultado la influencia de los datos a diferentes distancias. A partir de los datos proporcionados por el variograma teórico se realizará la estimación por krigeaje.

Procedimiento

El procedimiento correcto para su uso es:
  1. Eliminación de cualquier comportamiento tendencial.
  2. Selección de la h (lag en inglés) y del ángulo en el caso de que se trabaje con variogramas direccionales.
  3. Creación del variograma experimental basado en la muestra seleccionada.
  4. Selección de un variograma teórico que se adecúe al experimental, pues el variograma experimental no es una función donde se puedan realizar interpolaciones.

No hay comentarios:

Publicar un comentario