Imaginemos que tenemos un conjunto de datos que incluye las siguientes columnas:
ID_Paciente
: Identificador único para cada paciente.Edad
: Edad del paciente.Fumador
: Si el paciente es fumador (Sí/No).Diabetes
: Si el paciente tiene diabetes (Sí/No).Profundidad_Sondaje
: Medición en milímetros de la profundidad de sondaje periodontal.Nivel_Insercion
: Medición en milímetros del nivel de inserción clínica.Sangrado_Sondaje
: Presencia de sangrado al sondaje (Sí/No).
Vamos a generar primero un conjunto de datos ficticios y luego realizaremos algunos análisis básicos como:
- Estadísticas descriptivas (edad media, distribución de fumadores/diabéticos, etc.).
- Análisis de la relación entre fumar y la profundidad de sondaje.
- Visualización de la distribución de la profundidad de sondaje.
- Aquí tienes un ejemplo de cómo podrías hacer esto en Python:
import pandas as pdimport numpy as npimport matplotlib.pyplot as plt
# Crear datos ficticiosnp.random.seed(0)datos = { 'ID_Paciente': range(1, 101), 'Edad': np.random.randint(18, 80, 100), 'Fumador': np.random.choice(['Sí', 'No'], 100), 'Diabetes': np.random.choice(['Sí', 'No'], 100), 'Profundidad_Sondaje': np.random.uniform(1, 7, 100), 'Nivel_Insercion': np.random.uniform(1, 10, 100), 'Sangrado_Sondaje': np.random.choice(['Sí', 'No'], 100)}
df = pd.DataFrame(datos)
# Estadísticas descriptivasprint(df.describe())
# Análisis de la relación entre fumar y profundidad de sondajefumadores = df[df['Fumador'] == 'Sí']['Profundidad_Sondaje']no_fumadores = df[df['Fumador'] == 'No']['Profundidad_Sondaje']print(f"\nMedia de profundidad de sondaje en fumadores: {fumadores.mean()}")print(f"Media de profundidad de sondaje en no fumadores: {no_fumadores.mean()}")
# Visualizaciónplt.hist(df['Profundidad_Sondaje'], bins=15, edgecolor='black')plt.title('Distribución de la Profundidad de Sondaje')plt.xlabel('Profundidad de Sondaje (mm)')plt.ylabel('Frecuencia')plt.show().
No hay comentarios:
Publicar un comentario