Las estadísticas descriptivas pueden incluir medidas como la media, la mediana, la moda, la desviación estándar, el rango, entre otros.
Resumen estadístico: Edad Puntuacion count 50.000000 50.000000 mean 39.040000 48.900000 std 11.347858 30.334361 min 21.000000 1.000000 25% 30.000000 19.500000 50% 40.000000 51.500000 75% 46.750000 77.000000 max 59.000000 95.000000
Estos datos representan una estadística descriptiva de dos variables: edad y puntuación. Aquí hay una explicación de las métricas proporcionadas:
Edad:
- Count: Hay 50 observaciones de la variable de edad.
- Mean (Media): La edad promedio es aproximadamente 39.04 años.
- Standard Deviation (Desviación estándar): La desviación estándar de las edades es aproximadamente 11.35, lo que indica la dispersión de las edades con respecto a la media.
- Min (Mínimo): La edad mínima registrada es de 21 años.
- 25% (Primer cuartil): El 25% más bajo de las edades se sitúa en o por debajo de los 30 años.
- 50% (Segundo cuartil o Mediana): La mediana de las edades (el punto medio) es de 40 años, lo que significa que el 50% de las edades están por encima y el 50% por debajo de este valor.
- 75% (Tercer cuartil): El 75% más bajo de las edades se sitúa en o por debajo de los 46.75 años.
- Max (Máximo): La edad máxima registrada es de 59 años.
Puntuación:
- Count: Hay 50 observaciones de la variable de puntuación.
- Mean (Media): La puntuación promedio es aproximadamente 48.9.
- Standard Deviation (Desviación estándar): La desviación estándar de las puntuaciones es aproximadamente 30.33, lo que indica la dispersión de las puntuaciones con respecto a la media.
- Min (Mínimo): La puntuación mínima registrada es 1.
- 25% (Primer cuartil): El 25% más bajo de las puntuaciones se sitúa en o por debajo de 19.5.
- 50% (Segundo cuartil o Mediana): La mediana de las puntuaciones (el punto medio) es 51.5.
- 75% (Tercer cuartil): El 75% más bajo de las puntuaciones se sitúa en o por debajo de 77.
- Max (Máximo): La puntuación máxima registrada es de 95.
- Graficas de distribucion y la tendencia central de los datos
- Primero, se usara un histograma para mostrar la distribución de las edades y las puntuaciones. Luego, crearé gráficos de caja para ilustrar la tendencia central de ambos conjuntos de datos. Dado los datos, generarémos gráficos simulados para ayudarte a entender cómo lucirían.
- import matplotlib.pyplot as pltimport numpy as np# Datos simulados de edades (solo para propósitos ilustrativos)edades = np.random.normal(39.04, 11.35, 50) # Media, Desviación estándar, Tamañoplt.hist(edades, bins=10, color='skyblue')plt.title('Distribución de Edades')plt.xlabel('Edad')plt.ylabel('Frecuencia')plt.grid(True)plt.show().
Histograma de Edades:
Histograma de Puntuaciones:
# Datos simulados de puntuaciones (solo para propósitos ilustrativos)
puntuaciones = np.random.normal(48.9, 30.33, 50) # Media, Desviación estándar, Tamaño
plt.hist(puntuaciones, bins=10, color='lightgreen')
plt.title('Distribución de Puntuaciones')
plt.xlabel('Puntuación')
plt.ylabel('Frecuencia')
plt.grid(True)
plt.show()
Gráfico de Caja (Boxplot) para Edades y Puntuaciones:
El gráfico de caja muestra la distribución d
e los datos a través de cuartiles, la mediana y los valores atípicos.
# Creación de boxplots simulados para edades y puntuaciones
plt.boxplot([edades, puntuaciones], labels=['Edades', 'Puntuaciones'])
plt.title('Boxplot de Edades y Puntuaciones')
plt.ylabel('Valor')
plt.grid(True)
plt.show().
Estos gráficos (simulados en este caso) proporcionarían una representación visual de la distribución y la tendencia central de las edades y las puntuaciones. Recuerda que los datos simulados aquí son solo para demostración y no reflejan los datos reales . Si tienes los datos reales, podríamos utilizarlos para generar gráficos más precisos y significativos.
No hay comentarios:
Publicar un comentario