Proyecto: Análisis de Evaluación Sumativa para Estudiantes de Teleinformática
Este proyecto tiene como objetivo realizar un análisis de evaluación sumativa para estudiantes de teleinformática utilizando Python. Se utilizarán las bibliotecas pandas, matplotlib y seaborn para el análisis de datos. Supondremos que trabajamos con datos ficticios que representan el rendimiento de los estudiantes en diferentes áreas de estudio.
Paso 1: Definición de Variables y Generación de Datos
En este código, generamos datos ficticios que representan las calificaciones de estudiantes de teleinformática en diferentes áreas de estudio.
Paso 2: Análisis Exploratorio de Datos (EDA)
import pandas as pd
import numpy as np
# Definir el número de estudiantes y variables
num_estudiantes = 100
# Crear datos ficticios para cada estudiante
data = {
'ID_Estudiante': range(1, num_estudiantes + 1),
'Nombre': [f'Estudiante_{i}' for i in range(1, num_estudiantes + 1)],
'Calificacion_Redess': np.random.uniform(60, 100, num_estudiantes),
'Calificacion_Programacion': np.random.uniform(60, 100, num_estudiantes),
'Calificacion_Seguridad': np.random.uniform(60, 100, num_estudiantes),
'Calificacion_BaseDatos': np.random.uniform(60, 100, num_estudiantes)
}
df_teleinformatica = pd.DataFrame(data)
df_teleinformatica.to_csv('evaluacion_teleinformatica.csv', index=False)
Realizamos un análisis exploratorio de datos básico, cargamos los datos, mostramos las primeras filas, estadísticas descriptivas y visualizamos la distribución de calificaciones en Redes.
Paso 3: Visualización Multivariable
# Cargar datos desde el archivo CSV
df_teleinformatica = pd.read_csv('evaluacion_teleinformatica.csv')
# Mostrar las primeras filas del DataFrame
print(df_teleinformatica.head())
# Estadísticas descriptivas
print("\nEstadísticas Descriptivas:")
print(df_teleinformatica.describe())
# Visualizar la distribución de calificaciones en Redes
import seaborn as sns
import matplotlib.pyplot as plt
plt.figure(figsize=(10, 6))
sns.histplot(df_teleinformatica['Calificacion_Redess'], bins=20, kde=True)
plt.title('Distribución de Calificaciones en Redes')
plt.xlabel('Calificación')
plt.ylabel('Frecuencia')
plt.show()
ID_Estudiante Nombre Calificacion_Redess \
0 1 Estudiante_1 96.602131
1 2 Estudiante_2 82.946401
2 3 Estudiante_3 76.740475
3 4 Estudiante_4 80.132528
4 5 Estudiante_5 98.232998
Calificacion_Programacion Calificacion_Seguridad Calificacion_BaseDatos
0 96.413265 60.346297 65.868161
1 71.568032 62.207477 72.959515
2 73.023741 69.792161 90.111328
3 94.454162 66.234697 89.233126
4 83.719600 92.585254 69.325970
Estadísticas Descriptivas:
ID_Estudiante Calificacion_Redess Calificacion_Programacion \
count 100.000000 100.000000 100.000000
mean 50.500000 79.073870 80.345977
std 29.011492 11.696246 11.481143
min 1.000000 60.089460 61.050110
25% 25.750000 68.136503 70.944082
50% 50.500000 79.305733 79.701156
75% 75.250000 89.289794 89.657879
max 100.000000 99.875230 99.980218
Calificacion_Seguridad Calificacion_BaseDatos
count 100.000000 100.000000
mean 78.167014 77.211622
std 11.055309 11.715749
min 60.253979 60.214701
25% 69.991533 67.812113
50% 76.944026 75.543275
75% 86.969410 85.520551
max 99.657595 99.909071
Realizamos un análisis exploratorio de datos básico, cargamos los datos, mostramos las primeras filas, estadísticas descriptivas y visualizamos la distribución de calificaciones en Redes.
Paso 3: Visualización Multivariable
# Visualizar la relación entre las calificaciones en Programación y Seguridad
sns.pairplot(df_teleinformatica[['Calificacion_Programacion', 'Calificacion_Seguridad']])
plt.suptitle('Relación entre Calificaciones en Programación y Seguridad', y=1.02)
plt.show()
Utilizamos un gráfico de pares para explorar la relación entre las calificaciones en Programación y Seguridad.
Conclusiones:
Generación de Datos Ficticios: La creación de datos ficticios permite simular el rendimiento de los estudiantes y realizar análisis sin depender de conjuntos de datos reales.
Análisis Exploratorio de Datos: El EDA nos ha proporcionado información clave sobre la distribución de calificaciones y la relación entre diferentes áreas de estudio.
Visualización de Datos: Las visualizaciones, como histogramas y gráficos de pares, son herramientas útiles para entender la variabilidad y relaciones en los datos.
Aplicación en Teleinformática: Este proyecto puede aplicarse para evaluar el rendimiento de estudiantes de teleinformática en áreas específicas y proporcionar información valiosa para mejorar el proceso educativo.