La estadística descriptiva es
una rama de la estadística que se enfoca en el análisis y descripción de datos. En Python, existen varias librerías que permiten
realizar análisis estadísticos descriptivos, como NumPy, Pandas y SciPy .
Para calcular medidas descriptivas de tendencia
central, como la media, se puede utilizar la función mean()
de la librería NumPy . Por otro lado, para calcular medidas descriptivas de
dispersión, como la varianza y el desvío estándar, se puede utilizar la función var()
y std()
de la librería NumPy, respectivamente
Este código crea un conjunto de datos aleatorios de edades y puntuaciones y realiza las siguientes acciones:
- Muestra las primeras filas del conjunto de datos.
- Calcula un resumen estadístico utilizando el método
describe()
de Pandas. - Visualiza los datos mediante un histograma de las edades y un diagrama de dispersión entre la edad y las puntuaciones.
Asegúrate de tener las bibliotecas Pandas, NumPy y Matplotlib instaladas en tu entorno de Python para ejecutar este código.
Primeras filas del conjunto de datos: Edad Puntuacion 0 58 36 1 48 50 2 34 4 3 27 2 4 40 6 Resumen estadístico: Edad Puntuacion count 50.000000 50.000000 mean 39.040000 48.900000 std 11.347858 30.334361 min 21.000000 1.000000 25% 30.000000 19.500000 50% 40.000000 51.500000 75% 46.750000 77.000000 max 59.000000 95.000000
No hay comentarios:
Publicar un comentario