
ISBN: 978-84-1142-331-1
© Natividad Rico Ríos, Antonio José Reche Martínez
Introducción al análisis estadístico univariante
Introducción
La investigación en ciencias de la salud se basa en el uso de diversas herramientas y métodos para analizar los datos recopilados a través de estudios y experimentos. El análisis estadístico univariante es una técnica fundamental en este campo, ya que permite describir y analizar las variables de interés de forma individual y en relación con la población estudiada.
En este libro, exploraremos en detalle las técnicas y herramientas utilizadas en el análisis estadístico univariante en la investigación en ciencias de la salud y por tanto de aplicación en el laboratorio médico, y proporcionará una guía completa y práctica para aquellos que deseen comprender y aplicar estas técnicas en su trabajo de investigación.
Se tratará cómo utilizar diferentes métodos estadísticos para el análisis univariante y cómo interpretar los resultados obtenidos así como la selección de la prueba estadística adecuada para cada situación.
Este libro está diseñado para servir de apoyo tanto a aquellos que están comenzando en la investigación en ciencias de la salud como a profesionales experimentados que deseen refrescar sus conocimientos y habilidades en el análisis estadístico univariante.
Esperamos que sea una valiosa herramienta para ayudar a los investigadores a diseñar y llevar a cabo estudios rigurosos y a tomar decisiones informadas basadas en datos precisos y confiables.
La estadística descriptiva en ciencias de la salud se enfoca en describir conjuntos de datos que contienen información sobre varias características de individuos o unidades. Si solo nos interesa una variable, podemos categorizarla, representarla gráficamente de forma clara y resumirla.
Por eso, la estadística descriptiva, a través del análisis de una sola variable, nos permite por ejemplo clasificar a los recién nacidos en diferentes categorías de peso y representar gráficamente los rangos de peso más comunes.
También nos ayuda a resumir esa información para tener una idea de cómo se distribuyen los pesos de los recién nacidos en una determinada área de salud durante un periodo específico.
Para que los datos de una muestra sean útiles, es necesario hacer una inferencia o generalización de los mismos para toda la población. En este libro se presentan las herramientas para el análisis de una sola variable (análisis univariante), que permiten clasificar datos en tablas, crear representaciones gráficas y calcular estadísticas muestrales.
Para lograr esto, se diferencian las variables cuantitativas de las cualitativas.
Objetivo
El objetivo básico radica en alcanzar el conocimiento de la metodología y herramientas estadísticas necesarias para poder realizar e interpretar un análisis univariante de variables distintas, incluyendo su representación gráfica.
La categorización de variables
La tabla de frecuencias (distribuciones de frecuencias) es una herramienta utilizada para clasificar los datos de una variable. Es tan fundamental que a veces olvidamos que es la primera manipulación que hacemos del conjunto de datos. Construir una tabla de frecuencias básica implica determinar qué valores específicos se encuentran en la muestra y con qué frecuencia aparecen.
Categorización de variables cualitativas nominales
La categorización de variables cualitativas nominales es una técnica común en la investigación para clasificar datos en grupos o categorías. Este proceso implica asignar etiquetas o nombres a las respuestas que no pueden ser cuantificadas numéricamente, como género, raza, estado civil, entre otros.
La categorización permite a los investigadores analizar distribuciones y detectar patrones y tendencias en los datos. Además, la categorización de variables nominales puede ser utilizada para comparar grupos o subgrupos de la población y para analizar cómo las diferentes categorías se relacionan entre sí.
Existen diferentes técnicas para la categorización de variables nominales, incluyendo la codificación binaria, la codificación de efectos principales y la codificación de efectos interactivos. La codificación binaria implica la asignación de una etiqueta única a cada respuesta, mientras que la codificación de efectos principales y la codificación de efectos interactivos permiten la creación de múltiples etiquetas para cada respuesta. Estas técnicas pueden ser utilizadas para explorar las relaciones entre las categorías y las variables independientes y para determinar si hay alguna asociación significativa entre ellas.
En general, la categorización de variables nominales es una herramienta importante para analizar los datos cualitativos y puede ser utilizada en una amplia gama de disciplinas incluyendo el ámbito sanitario.
Si tomamos por tanto datos nominales, también llamados categóricos, podríamos estudiar el ejemplo de un estudio sobre el grupo sanguíneo realizado en 20 pacientes ingresados en un determinado Hospital.
- Determinar los posibles valores posibles. En éste caso serían: A, B, AB y 0
- Contabilizar las ocasiones en que se da cada valor posible (A=5, B=5, AB=3, 0=7).
- Finalmente habría que construir una tabla con las categorías y la frecuencia, u ocasiones en que se da ese dato. La suma total debe coincidir con el tamaño de muestra, 20 en el ejemplo.
En esta instancia, la tabla proporciona información relevante ya que se trata de un tamaño de muestra reducido. No obstante, si en lugar de 20 elementos, el tamaño de la muestra fuese de 7284, entonces, sería necesario incluir una tercera columna en la tabla que muestre la frecuencia relativa o el porcentaje de cada categoría en relación al total, ya que la información proporcionada sería si no limitada. Así, la tabla incluiría una columna adicional a la derecha de las frecuencias absolutas que mostraría las proporciones o frecuencias relativas correspondientes. La suma de las frecuencias absolutas debería ser igual al número total de datos, mientras que la suma de las frecuencias relativas debería ser igual a 1 y se expresaría en porcentaje.
En la literatura científica, hay diferentes formas de representar las frecuencias absolutas, como x o f. Por otro lado, las formas de denotar las frecuencias relativas también pueden variar, como f o pi.
Índice
Capítulo 1: Introducción al análisis estadístico univariante
1.1. Introducción
1.2. Objetivos
Capítulo 2. La categorización de variables
2.1. Categorización de variables cualitativas nominales
2.2. Categorización de variables cualitativas ordinales
2.3. Categorización de variables cuantitativas
Capítulo 3. Representación gráfica de variables
3.1. Diagrama de sectores
3.2. Diagrama de barras
3.3. Diagrama de cajas
3.4. Histogramas
3.5. Polígono de frecuencias
Capítulo 4. Resumen del análisis univariante de variables cuantitativas
4.1. Medidas de posición de tendencia central
4.1.1. Media aritmética
4.1.2. Mediana
4.1.3. Moda
4.1.4. Media geométrica
4.2. Medidas de posición de tendencia no central
4.3. Medidas de dispersión
4.3.1. La Varianza
4.3.2. Desviación típica
4.3.3. Rango
4.3.4. Rango intercuartílico
4.3.5. Coeficiente de variación
4.4. Medidas de forma y su aplicación a la representación gráfica
4.4.1. Coeficiente de asimetría de Fisher
4.4.2. Coeficiente de aplastamiento o de Curtosis
Capítulo 5. Valores Atípicos
5.1. Valores atípicos
Referencias y bibliografía