Reto 2: Análisis Exploratorio de Datos

Dataset Cover

Bienvenidos al segundo reto de la asignatura Aplicaciones Big Data IV: Introducción a Black Ops. El objetivo de esta prueba es demostrar los conocimientos adquiridos en el análisis exploratorio de los datos (EDA). Para ello, exploraremos un dataset que contiene estadísticas sobre jugadores de fútbol en el top de las 5 primeras ligas en el año 2023/24. Dicha tabla ya ha sido ingestada y preprocesada de antemano, con lo cual nuestro objetivo es extraer información útil para poder tomar decisiones fundamentadas.

Por si resulta de utilidad, podéis consultar el Notebook de práctica de EDA con PySpark en el siguiente gate.io login. Ahí se cubren con detalle todos los aspectos necesarios para la consecución de este ejercicio.

Instrucciones:

Detalles del Dataset

Este dataset contiene datos detallados de los futbolistas en las 5 ligas principales durante la temporada 2023/2024. Proporciona estadísticas individuales que abarcan diferentes aspectos del rendimiento de los jugadores, lo que permite analizar y comparar su desempeño en el campo.

Descripción de los Campos

Resultados de los gráficos pedidos en la prueba

Distribución de la edad de los jugadores

Histogram Age

Media de edad por equipo según la posición

Pivot table age

Acumulación de tarjetas rojas por equipo, top 5

Tarjetas Rojas por equipo