Unidad 2: Aspectos Estadísticos en Epidemiología
1. Conceptos
de datos, variables y frecuencias en epidemiología.
En
epidemiología, los conceptos de datos, variables y frecuencias son
fundamentales para el estudio de la distribución y determinantes de las
enfermedades en poblaciones. A continuación, se presenta cómo se aplican estos
conceptos en este campo:
a.
Datos en Epidemiología:
Los datos son información que se
recopila, registra o representa en diferentes formas, como números, palabras,
imágenes o cualquier otro tipo de símbolos. Los datos son esenciales para la
toma de decisiones informadas y el análisis en diversas disciplinas.
En epidemiología, los datos son
la información que se recopila sobre la salud de las poblaciones. Pueden
incluir casos de enfermedades, factores de riesgo, exposiciones, características demográficas y otros aspectos relevantes
para comprender la salud pública. Estos datos pueden provenir de registros
médicos, encuestas, estudios observacionales y otros métodos de recolección de
información.
b.
Variables en Epidemiología:
Una
variable es una característica o propiedad que puede tomar diferentes valores.
En el contexto del análisis de datos, las variables son atributos específicos
que se registran o miden en una población o muestra. Las variables pueden ser
de diferentes tipos:
1) Variables
Categóricas:
Representan categorías o grupos.
Ejemplos: género (masculino/femenino), color (rojo/azul/verde), etc.
2) Variables
Numéricas:
Representan valores numéricos.
Pueden ser continuas (pueden tomar
cualquier valor dentro de un rango, como la altura) o discretas (solo pueden tomar valores
específicos, como el número de hijos).
3) Variables
Ordinales:
Representan categorías con un
orden específico. Ejemplos: nivel educativo (primaria/secundaria/universidad),
calificación (bajo/medio/alto).
Las variables en epidemiología
son los elementos específicos que se miden o registran en los datos. Estas
variables pueden ser diversas y se dividen en varias categorías, como:
4)
Variables de Resultado o Respuesta:
Estas variables representan la
presencia o ausencia de una enfermedad o condición de salud específica. Los
ejemplos incluyen la incidencia (nuevos casos) y la prevalencia (número total
de casos) de una enfermedad.
5)
Variables de Exposición o Riesgo:
Estas variables están
relacionadas con factores que pueden influir en la probabilidad de desarrollar
una enfermedad. Por ejemplo, la exposición a un agente infeccioso, el hábito de
fumar o la exposición a ciertas sustancias químicas.
6)
Variables de confusión:
Son variables que pueden
distorsionar la relación entre la exposición y el resultado. Los epidemiólogos
las tienen en cuenta para asegurarse de que los resultados no estén influenciados por otros factores.
c.
Frecuencias en Epidemiología:
Las frecuencias se refieren a
cuantas veces ocurren un evento específico en un conjunto de datos. En el
análisis de datos, las frecuencias son una forma de resumir la distribución de
datos y comprender la ocurrencia relativa de diferentes valores en una
variable.
1) Frecuencia
Absoluta:
Es la cantidad total de veces que
ocurre un valor en un conjunto de datos.
2) Frecuencia
Relativa:
Es la proporción de la frecuencia
absoluta de un valor con respecto al tamaño total del conjunto de datos.
3) Frecuencia
Acumulada:
Es la suma acumulativa de las
frecuencias absolutas a medida que avanza a través de los valores ordenados.
En epidemiología las frecuencias
son medidas clave para describir la distribución de enfermedades y factores de riesgo
en una población. Algunos términos comunes relacionados con las frecuencias en
epidemiología son:
4)
Incidencia:
Es la tasa de nuevos casos de una
enfermedad en una población durante un período específico de tiempo. Se expresa
generalmente como el número de casos nuevos por unidad de población.
5)
Prevalencia:
Es el número total de casos de
una enfermedad en una población en un momento dado. Puede ser prevalencia
puntual (en un momento específico) o prevalencia acumulada (a lo largo de un
período).
6)
Tasa:
Es una medida de frecuencia que
relaciona el número de eventos (como casos de enfermedades) con una población
en riesgo durante un período de tiempo determinado.
7)
Razón:
Es la comparación de las tasas de
dos grupos diferentes para evaluar diferencias en la prevalencia o incidencia
de una enfermedad.
Las frecuencias son especialmente útiles para construir histogramas y
gráficos de barras que visualizan la distribución de datos en una variable. Estos
conceptos y medidas permiten a los epidemiólogos analizar y comprender la
propagación de enfermedades, identificar factores de riesgo y tomar decisiones
informadas sobre la salud pública.
Los datos son la información recopilada, las variables son las
características que se miden en los datos y las frecuencias son medidas que
resumen cuántas veces ocurren ciertos valores en esas variables. Estos
conceptos son fundamentales en el análisis de datos y estadísticas.
2. Presentación
y tipos de datos en epidemiología
a)
Presentación de Datos en Epidemiología:
La presentación adecuada de los
datos en epidemiología es crucial para comunicar resultados y conclusiones de
manera clara y efectiva. A continuación, se presenta algunas formas comunes de
presentar datos en epidemiología:
1)
Tablas:
Las tablas son una forma organizada
de presentar datos numéricos. Pueden utilizarse para mostrar características
demográficas, tasas de enfermedades, exposiciones y otros datos relevantes.
2)
Gráficos:
Los gráficos son herramientas
visuales poderosas para resumir y comparar datos. Algunos tipos comunes de
gráficos en epidemiología incluyen:
Gráficos de Barras:
Útiles para comparar categorías
de datos, como tasas de enfermedades en diferentes grupos.
Gráficos de Sectores:
Muestran la proporción de
diferentes categorías en un todo.
Histogramas:
Representan la distribución de
datos numéricos en intervalos o clases.
Gráficos de Líneas:
Ideales para mostrar tendencias a
lo largo del tiempo, como la incidencia de una enfermedad.
3)
Mapas:
Los mapas geográficos son
especialmente útiles para mostrar la distribución geográfica de enfermedades.
Pueden destacar áreas de alta incidencia y ayudar a identificar patrones
espaciales.
4)
Curvas Epidemiológicas:
Representan la frecuencia de
casos de una enfermedad a lo largo del tiempo. Pueden ayudar a identificar
hermanos y patrones estacionales.
5)
Diagramas de Flujo:
Pueden ser utilizados para
representar la secuencia de eventos en un brote epidémico o el proceso de
transmisión de una enfermedad.
b) Tipos
de Datos en Epidemiología:
En epidemiología, los tipos de
datos que se manejan son diversos y pueden clasificarse en diferentes
categorías:
1)
Datos Demográficos:
Incluyen información sobre la
edad, el género, la etnia y otras características demográficas de la población.
2)
Datos de Enfermedades:
Involucran información sobre la
incidencia y prevalencia de enfermedades, así como la gravedad y duración de
los síntomas.
3)
Datos de Exposición:
Se refiere a la exposición a
factores de riesgo, como agentes infecciosos, productos químicos, hábitos
alimentarios y comportamientos relacionados con la salud.
4)
Datos de Resultados en Salud:
Incluyen medidas de resultados de
salud, como la mortalidad, la morbilidad, las complicaciones y la calidad de
vida.
5)
Datos de Intervenciones:
Se relacionan con la evaluación
de la efectividad de intervenciones médicas, programas de prevención y
tratamientos.
6)
Datos de Tiempo:
Son datos que se recopilan a lo
largo del tiempo para analizar tendencias, estacionalidad y cambios en la
incidencia de enfermedades.
La presentación y clasificación adecuada de los datos son esenciales en
epidemiología para comprender las enfermedades, identificar patrones y tomar
decisiones informadas sobre la salud pública.
3. Medidas
de tendencia central y dispersión en epidemiología
En
epidemiología, las medidas de tendencia central y dispersión son herramientas
esenciales para resumir y analizar datos relacionados con la incidencia,
prevalencia y otros aspectos de enfermedades y factores de riesgo en
poblaciones. A continuación, algunas de las medidas comunes que se utilizan en
este campo:
a)
Medidas de Tendencia Central:
1)
Medios:
La media es el promedio
aritmético de un conjunto de valores. En epidemiología, los medios se utilizan
para calcular, por ejemplo, la edad promedio de los pacientes con una
enfermedad específica.
2)
Mediana:
La mediana es el valor central en
un conjunto de datos ordenados. A diferencia de los medios, no se ve afectada
por valores atípicos y es útil cuando los datos no están distribuidos de manera simétrica.
3)
Moda:
La moda es el valor que más se
repite en un conjunto de datos. Puede ser útil para identificar el valor más
común en un grupo de pacientes o en un conjunto de resultados de laboratorio.
c)
Medidas de Dispersión:
1)
Rango:
El rango es la diferencia entre
el <valor máximo y el valor mínimo en un conjunto de datos. Proporciona
información sobre la variabilidad total de los datos.
2)
Desviación Estándar:
La desviación estándar mide la
dispersión de los valores con respecto a la media. Cuanto mayor sea la
desviación estándar, mayor será la variabilidad de los datos.
3)
Varianza:
La varianza es el promedio de las
diferencias al cuadrado entre cada valor y la media. Es un indicador de la
dispersión total en los datos.
4)
Cuartiles:
Los cuartiles dividen el conjunto
de datos ordenados en cuatro partes iguales. El primer cuartil (Q1) es la
mediana de la mitad inferior de los datos, el segundo cuartil (Q2) es la
mediana general, y el tercer cuartil (Q3) es la mediana de la
mitad superior de los datos.
5)
Coeficiente de variación:
Es la desviación estándar
dividida por la media, expresada como un porcentaje. Se utiliza para comparar
la variabilidad relativa entre diferentes conjuntos de datos.
6)
Rango Intercuartil (RIC):
Es la diferencia entre el tercer
cuartil (Q3) y el primer cuartil (Q1). Se utiliza para evaluar la variabilidad
entre los valores que se encuentran en el medio del conjunto de datos.
Estas de tendencia central y dispersión son fundamentales para resumir y
analizar la variabilidad y distribución de los datos en epidemiología, lo que a
su vez contribuyen a comprender la propagación de enfermedades,
identificar factores de riesgo y tomar decisiones informadas en salud pública.
4. Estadística
descriptiva e inferencial en Epidemiología
a)
Estadística Descriptiva en Epidemiología:
La estadística descriptiva en
epidemiología implica la presentación y resumen de datos relevantes sobre la
incidencia, prevalencia y otros aspectos de las enfermedades y los factores de riesgo
en poblaciones. Su objetivo principal es proporcionar una descripción
concisa y comprensible de los datos para que los epidemiólogos puedan analizar
y comunicar la situación de salud pública. Algunas técnicas y medidas de estadística descriptiva utilizadas en epidemiología
incluyen:
1)
Tabulación y Gráficos:
Creación de tablas y gráficos
para mostrar la distribución de datos, como tasas de enfermedades en diferentes
grupos demográficos o a lo largo del tiempo.
2)
Medidas de Tendencia Central y Dispersión:
Cálculo de como la media,
mediana, moda, desviación estándar y rango para resumir la ubicación y
variabilidad de los datos.
3)
Distribuciones de Frecuencia:
Creación de histogramas y
gráficos de frecuencia para visualizar la distribución de datos numéricos.
4)
Estadísticas de Resumen:
Calcular la incidencia,
prevalencia y otras tasas de enfermedades para caracterizar su magnitud en una
población.
b) Estadística
Inferencial en Epidemiología:
La estadística inferencial en
epidemiología se centra en la extrapolación de conclusiones más amplias basadas
en muestras de datos recopilados. Implica hacer inferencias o predicciones
sobre toda una población en función de los datos observados en una
muestra. Algunas técnicas y conceptos utilizados en estadística inferencial en
epidemiología son:
1)
Inferencia de Población:
Utilizar datos de muestra para
hacer suposiciones sobre una población más amplia. Por ejemplo, estimar la
prevalencia de una enfermedad en una población basada en una muestra representativa.
2)
Intervalos de Confianza:
Establecer rangos de valores en
los que se espera que esté una estadística de población. Los intervalos de
confianza brindan una idea de la precisión de una estimación basada en una muestra.
3)
Pruebas de Hipótesis:
Evaluar la significancia
estadística de una diferencia observada entre grupos o variables. Por ejemplo,
determine si una exposición particular está asociada con una mayor incidencia de una enfermedad.
4)
Regresión:
Utilizar modelos estadísticos
para examinar la relación entre variables y predecir resultados. Por ejemplo,
analice cómo los factores de riesgo se relacionan con la probabilidad de
desarrollar una enfermedad.
5)
Análisis de Supervivencia:
Estudiar la duración del tiempo
hasta que ocurre un evento (como el inicio de una enfermedad) utilizando
técnicas de análisis de supervivencia, como el Kaplan-Meier y el modelo de
riesgos proporcionales de Cox.
La estadística inferencial en epidemiología es vital para sacar
conclusiones más allá de los datos observados y para comprender las
asociaciones y relaciones subyacentes en la salud de la población.
Bibliografía:
(1). Ortiz,Esandi,
Bortman, (2004). Epidemiología Básica y Vigilancia de la Salud. Ministerio de
Salud de la Nación. Segunda edición.
(2). Ministerio
de Salud de la Nación. (2004). Módulo Nº 2. Epidemiología.
Ver Unidad 3: Epidemiología de Enfermedades y Riesgos