2 Fundamentos de Estadística Aplicada a la Gestión de Riesgos

Librerías

library(car)
library(clusterSim)
library(ggplot2)

¿Qué relación tienen Charles Darwin, Francis Galton y Karl Pearson?

Charles Darwin (1809-1882) Fracis Galton (1822-1911) Karl Pearson (1857-1936)

Charles Darwin (1809-1882), Fracis Galton (1822-1911), Karl Pearson (1857-1936)

  • Galton nace en Birmingham (Inglaterra). Viaja por el mundo realizando estudios en geografía y en 1850 se le otorga la medalla de oro de la Royal Geographical Society.

  • Influenciado por su primo, Charles Darwin, dedica la segunda parte de su vida a probar la teoría de la evolución

  • Detectó que padres de estatura pequeña tenían hijos ligeramente más altos y que padres altos tenían hijos ligeramente más bajos. De ahí la palabra regresión (Gorroochurn (2016)).

2.0.1 ¿Qué es la estadística?

  • El siglo XIX es el punto de encuentro entre dos disciplinas que evolucionaron independientemente: el cálculo de probabilidades o teoría matemática de los juegos de azar (derivada del vocablo árabe al zhar, que signigica dado), que nace en el siglo XVII y la Estadística (o ciencia del Estado, del latín Status).

La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de ello, gracias al análisis de estos datos, unos significados precisos o unas previsiones para el futuro (Galindo (2015))

2.0.1.1 Clasificación

  • La Estadística Descriptiva o Análisis Exporatorio de Datos, resume y describe datos a través de la presentación de información en forma de tablas y gráficos.

  • La Estadística Inferencial: va más allá de los datos. Trata, a partir de una muestra, determinar características de una población objetivo de investigación.

2.0.1.2 Definiciones básicas

Unidad muestral o experimental: Una unidad es una persona, animal, planta o cosa que es examinada por un investigador; es el objeto básico sobre el cual el estudio o experimento se lleva a cabo.

Población o universo: Es una colección completa de personas, animales, plantas o cosas, con el objeto de obtener conclusiones sobre la población de la cual proviene.

Muestra: Es un grupo de unidades seleccionadas de la población de acuerdo con un plan o regla, con el objeto de obtener conlusiones sobre la población de la cual proviene.

Tamaño muestral: número de unidades que constituyen la muestra.

2.0.1.3 Ejemplos (¿Cuál es la población? ¿Cuál es la unidad muestral?):

  • La dueña de un almacén desea estimar el gasto medio de compra de sus clientes en su almacén en el último año.
  • En un estudio se desea conocer el rating de sintonía de los canales de televisión de una ciudad.

2.0.1.4 Datos y escalas de medición

2.0.1.4.1 Números índice
  1. Simple

\[ I_{0}^{t}(X) = \frac{X_t}{X_0}100 \]

  1. En cadena

\[ IC^{t}(X) = \frac{X_t}{X_{t-1}}100 \]

  1. Tasa de variación

\[ Tasa_{t_1}^{t_2}(X) = \frac{X_{t_2}-X_{t_1}}{X_{t_1}} \]

  1. Tasa media de variación (entre \([t,t+k]\))

\[ T_k = \left(\sqrt[k]{\frac{X_{t+k}}{X_t}-1}\right)100 \]

2.0.1.5 Tipos de variables

Variable estadística: Es una característica de los individuos que puede ser observada o medida.

¿Qué es un dato? medición o valor de una variable estadística.

  • Cualitativas (descriptivas o categóricas): comprenden etiquetas o nombres que se usan para identificar un atributo de cada elemento. Ejemplos: sexo, profesión, marca de ropa.

  • Cuantitativas (numéricas): Describen características medibles. Ejemplos: número de hijos, número de páginas de un libro.

    • Discretas: son discretas si sus valores pueden ser contados (pertenecen a los números enteros). Ejemplo: clientes que entran a un almacén, número de errores ortográficos.

    • Continuas: sus valores pueden tomar cualquier valor en un intervalo considerado (pertenecen a los números reales). Ejemplos: edad, perso, talla.

2.0.1.6 Escalas de medición

La medición es el proceso de asignar un valor a una variable de un elemento de observación. Este proceso usa diferentes escalas:

  • Nominal: a los datos se les puede asignar un código, en la forma de un número, donde los números son simplemente una etiqueta. Únicamente pueden ser contados, no pueden ser ordenados ni medidos. Ejemplo: sexo, estado civil.

  • Ordinal: si a los datos se les puede asociar un orden o asociar una escala. Pueden ser contados y ordenados, pero no pueden ser medidos. Ejemplo: escalas de películas, del 1 al 5.

  • Intervalo: si los datos pueden tomar cualquier valor dentro de un intervalo finito o infinito, existe un cero relativo. Pueden ser contados y ordenados; son válidas la suma y la resta, la multiplicación y la división. Ejemplos: temperatura (cero no significa ausencia de temperatura). Puntajes en pruebas (cero no significa que no sabe nada).

  • Razón: si los datos pueden tomar cualquier valor dentro de un intervalo finito o infinito, existe un cero absoluto. Pueden ser contados y ordenados; son válidas la suma, resta, multiplicación y división. Ejemplos: estatura, velocidad, edad.

2.0.1.7 Valores atípicos

También conocidos como inusuales, extremos o outliers, es una observación que es lejana, en valor, del resto de datos.

No se los debe eliminar sin justificación previa, ¿por qué?