2  Generalidades

2.1 Conceptos básicos

  • Estadística

    Existen diferentes definiciones de estadística, a continuación se presentan algunas de ellas:

    • La estadística es una discipina de las matemátias aplicadas que se dedica al manejo de los datos numéricos; es decir: es el método para recolectar, elaborar, analizar e interpretar datos numéricos. (Celis and Labrada 2014)

    • La estadística se ocupa de los métodos científicos que se utilizan para recolectar, organizar, resumir, presentar y analizar datos así como para obtener conclusiones válidas y tomar decisiones razonables con base en este análisis. (Spiegel and Stephens 2009)

    • El campo de la estadística trata de la recolección, presentación, procesamiento, análisis y uso de datos para tomar decisiones, solucionar problemas y diseñar productos y procesos. (Matus 2006)

    • La estadística es la ciencia que estudia cuantitativamente los fenómenos aleatorios. (García 2012)

    Se puede concluir que en su sentido más amplio la estadística es una disciplina que conlleva el análisis de datos, y partiendo de esa base muy general se deduce que puede aplicarse a muchos campos del conocimiento; así pues, cuando hablamos de la estadística aplicada a la biología o a sus ramas le llamamos bioestadística.

  • Variables y constantes

    Ambas se refieren a valores numéricos que pueden representarse a través de símbolos.

    Respecto a la diferencia entre una y otra (Chiang 1994) indica que una variable es algo cuya magnitud puede cambiar; es decir, algo que puede tomar diferentes valores, mientras que una constante es una magnitud que no cambia y, por tanto, es la antítesis de una variable.

    A continuación se presenta a manera de ejemplo un pequeño listado de variables comunes en medicina veterinaria:

    Edad, peso, altura, raza, sexo, color, frecuencia respiratoria, condición corporal, consumo de alimento, ganancia diaria de peso, concentración de hemoglobina en sangre.

  • Coeficiente

    Un coeficiente es una constante que va unida a una variable. (Chiang 1994)

    Un coeficiente generalmente antecede a la variable y la afecta o condiciona. Si tenemos la expresión “y = 5x” , donde “5” es el coeficiente y “x” la variable, podemos interpretar que “y” es cinco veces el valor de x.

  • Población

    Una población o universo es una colección o totalidad de posibles individuos, especímenes, objetos o medidas de interés sobre los que se hace un estudio. (Gutierrez and De la Vara 2008)

    Las poblaciones pueden ser de acuerdo a (Gutierrez and De la Vara 2008) de dos tipos:

    • Poblaciones finitas

      Poblaciones finitas o pequeñas son aquellas en que se pueden medir todos los individuos para tener conocimiento “exacto” de las características de esa población.

    • Poblaciones infinitas o grandes son aquellas en que es imposible e incosteable medir a todos los individuos.

  • Muestra

    Una muestra es una porción de una población; dependiendo de múltiples factores, una muestra puede o no ser representativa de la población de donde se obtuvo.

    • Muestra no representativa

      Es una muestra cuyas características difieren mucho de las características de la población de donde se obtuvo, esto puede ocurrir por muchas razones, una de ellas es por seleccionar una muestra muy pequeña , o cuando hay sesgo de selección (por ejemplo, si mediante un experimento deseo probar la superioridad del alimento “A” respecto al alimento “B” ).

    • Muestra representativa

      Es una muestra cuyas características son muy similares a las de la población de donde se obtuvo, este es el tipo de muestra ideal en estadística ya que como indica (Spiegel and Stephens 2009) si la muestra es representativa permite inferir conclusiones válidas acerca de la población.

  • Parámetro y estadístico

    Muchas veces estas definiciones suelen confundirse o utilizarse indistintamente; sin embargo, pese a que ambas se refieren a cálculos numéricos, no son exactamente lo mismo, de acuerdo a (Triola 2004) la diferencia está en que un parámetro describe algunas características de una población, mientras que un estadístico describe algunas características de una muestra.

  • Problemas de investigación típicos en medicina veterinaria

    La investigación en medicina veterinaria es amplia y la estadística es útil para que los resultados tengan validez, algunos ámbitos de la investigación veterinaria incluyen ((pero no se limitan) a los estudios epidemiológicos, estudios de salud pública , efectividad de medicamentos, y estudios de rendimientos zootécnicos.

2.2 Método científico

La estadística al ser una herramienta que interviene en múltiples disciplinas científicas y ayuda a darle validez a las investigaciones es lógico que se valga del método científico.

El método científico adaptado a la estadística como bien menciona (Monroy 2008) tiene cinco pasos básicos:

  • Definir cuidadosamente el problema.

  • Formular un plan para recopilar los datos necesarios.

  • Reunir los datos, recopilar la información.

  • Analizar e interpretar los mismos.

  • Anotar conclusiones y otros descubrimientos de manera que sean fácilmente comprendidos por los que utilizan los resultados al tomar decisiones.

2.3 Tipos de variables

Hay diferentes criterios para catalogar una variable, en su sentido más amplio en estadística se hablará de variable aleatoria, la cuál (García 2012) define como una variable cuyos posibles valores son resultados de un fenómeno aleatorio. Así pues, es necesario definir qué es aleatorio, sobre esto el mismo (García 2012) indica que un fenómeno aleatorio es cualquier hecho de la naturaleza o de la actividad humana cuyo resultado no se puede prever con exactitud, es decir, que existe sobre él un cierto grado de incertidumbre.

Partiendo de las variables aleatorias, la clasificación se puede hacer de acuerdo a los siguientes criterios:

  • Por su naturaleza

    • Cuantitativas

      Son variables numéricas y pueden clasificarse según el proceso de su obtención como continuas y discretas.

      • Continuas

        Una variable continua es aquella que teóricamente puede tomar cualquier valor dentro de un intervalo de valores. (Monroy 2008)

        Surge mediante el proceso de medición y aceptan números decimales.(Martínez 2020)

      • Discretas

        Una variable es discreta cuando los valores que puede tomar están separados entre sí por una determinada cantidad. (Monroy 2008)

        Surge mediante el proceso de conteo y sólo acepta números enteros.(Martínez 2020)

    • Cualitativas

      Son variables no numéricas y hacen referencia a cualidades o atributos de un elemento, también se les llama variables categóricas. Pueden clasificarse según su número de categorías como dicotómicos y politómicas.

      • Dicotómicas

        Posee solamente dos categorías. Ejemplos de variables dicotómicas son: macho, hembra; sano, enfermo; vivo, muerto; grande, pequeño; infestado, no infestado.

      • Politómicas

        Posee más de dos categorías. Ejemplos de variables politómicas son: razas de bovinos (Holstein, Jersey, Pardo suiza, Normanda); grande, mediano, pequeño; colores de caballos (palomino, alazán, moro, retinto, bayo).

  • Por su escala de medición

    • Nominal (aplica para variables cualitativas)

      Las unidades observacionales se agrupan en clases excluyentes según determinada propiedad, con lo que se define una partición sobre el conjunto de tales unidades. Los número se usan como identificadores o nombres. La operación matemática permitida es el conteo. (Orlandoni 2010)

    • Ordinal (aplica para variables cualitativas)

      Los valores de la escala representan categorías o grupos de pertenencia, con cierto orden asociado, pero no una cantidad mensurable. La escala ordinal tiene las propiedades de identidad y magnitud.(Orlandoni 2010)

    • De intervalo (aplica para variables cuantitativas)

      Esta escala representa magnitudes, con la propiedad de igualdad de la distancia entre puntos de escala de la misma amplitud.

      Aquí puede establecerse orden entre sus valores, hacerse comparaciones de igualdad, y medir la distancia existente entre cada valor de la escala. El valor cero de la escala no es absoluto, sino un cero arbitrario: no refleja ausencia de la magnitud medida, por lo que las operaciones aritméticas de multiplicación y división no son apropiadas. Cumple con las propiedades de identidad, magnitud e igual distancia. (Orlandoni 2010)

    • De razón (aplica para variables cuantitativas)

      Tiene las mismas propiedades que la escala intervalos, y además posee el cero absoluto. Aquí el valor cero no es arbitrario, pues representa la ausencia total de la magnitud que se está midiendo. Con esta escala se puede reaizar cualquier operación lógica (ordenamiento, comparación) y aritmética. A iguales diferencias entre los números asignados corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio.(Orlandoni 2010)

  • Por su interrelación

    Cuando se evalúan al menos dos variables y se piensa que de alguna forma ambas están relacionadas se pueden clasificar de acuerdo a su interrelación. Esto se hace comunmente en estudios epidemiológicos cuando se quiere evaluar la asociación causal entre diferentes factores (o variables), también se utiliza ampliamente esta clasificación cuando se hacen modelos de regresión los cuáles veremos más adelante. Por su interrelación las variables se pueden clasificar como dependientes o como independientes.

    • Dependientes

      La variable dependiente es una variable que pretende ser explicada o predicha utilizando un modelo. Los valores de esta variable dependen de otras variables. También se conoce como la variable de respuesta, variable de resultado, y se denota comunmente utilizando una Y. Tradicionalmente se grafica en el eje vertical o eje Y.(Frost 2019)

    • Independientes

      Las variables independientes son las variables que se incluyen en el modelo para explicar o predecir cambios en la variable dependiente. También se le conoce como variable predictora o variable de entrada, y se denota comunmente utilizando una X. Tradicionalmente se grafica en el eje horizontal o eje X.(Frost 2019)

  • Resumen

    A continuación se muestra un esquema que resume los tipos de variables.

flowchart LR
    Alpha["Variables
            aleatorias"] --> conectorAlpha{{"Por su
                                      naturaleza"}}
    conectorAlpha --> A1("Cuantitativas") & B1("Cualitativas")
    A1 --> conectorA{{"Por su proceso
                                de obtención"}}
    conectorA --> A2_1("Continuas") & A2_2("Discretas")
    A2_1 & A2_2 --> conectorA2{{"Por su
                                 escala"}}
    conectorA2 --> A3_1("De
                         intervalo") & A3_2("De
                                             razón")
    B1 --> conectorB2{{"Por su número
                            de categorías"}}
    conectorB2 --> B2_1("Dicotómicas") & B2_2("Politómicas")
    B2_1 & B2_2 --> conectorB3{{"Por su
     escala"}}
     conectorB3 --> B3_1("Nominal") & B3_2("Ordinal")