Python – Prediciendo partidos de fútbol
Soy bastante nuevo en python y pandas, y aún tengo muchas dificultades. El curso al que asisto me dio una tarea que parece imposible para mí, espero que alguien pueda ayudarme.
Tengo un dataframe (simplificado, contiene los resultados de toda la temporada 16):
season date team1 team2 score1 score2 result
12 2016 2016-08-13 Hull City Leicester City 2.0 1.0 team1_win
13 2016 2016-08-13 Arsenal Swansea City 0.0 1.0 team2_win
14 2016 2016-08-13 Southampton Manchester Utd 1.0 1.0 empate
15 2016 2016-08-13 Middlesbrough Stoke City 1.0 1.0 empate
16 2016 2016-08-13 Crystal Palace West Bromwich Albion 0.0 1.0 team2_win
... ... ... ... ... ... ... ...
Ahora, me gustaría predecir cuántos goles va a marcar el Arsenal y el Manchester en el último partido de la temporada Arsenal-Manchester. (Probablemente no funcione con los datos que te proporcioné aquí). Esto se debe hacer con una regresión de conteo.
Intenté usar el código que obtuve de otro ejemplo, pero fracasé miserablemente:
modelArs = smf.poisson("score1 ~ score2 + team2", data=train_data)
resultArs = modelManc.fit();
Y sé que probablemente lo que hice allí es una tontería total, pero estoy completamente perdido.
La segunda tarea es mostrar qué equipo va a ganar, basándonos en un árbol de decisión.
La tercera tarea es utilizar una regresión mnlogit para mostrar la probabilidad de empate y victoria para cada equipo.
Sé que estoy pidiendo mucho, pero cualquier ayuda me ayuda mucho. También incluir información sobre lo que hiciste realmente me ayudaría. Solo estoy tratando de aprobar el curso de alguna manera y terminar con python después.
davy.ai
Estimado estudiante con dificultades,
Entiendo que aprender un nuevo lenguaje de programación y una herramienta de análisis de datos como Python y Pandas puede resultar abrumador. ¡No te preocupes, no estás solo! Todos hemos pasado por eso. La buena noticia es que, con algo de práctica y perseverancia, eventualmente lo dominarás.
En cuanto a tu tarea, permíteme proporcionarte algunas orientaciones.
Para la tarea de regresión de conteo, tienes razón en que la regresión de Poisson es un buen modelo para usar. En Python, puedes utilizar la biblioteca statsmodels para ajustar dicho modelo. Aquí tienes un ejemplo de código que puedes adaptar a tus datos:
Para la tarea del árbol de decisiones, puedes utilizar scikit-learn, que es otra biblioteca popular para el aprendizaje automático en Python. Aquí tienes un ejemplo de código:
Finalmente, para la tarea de regresión logística multinomial, nuevamente puedes utilizar statsmodels. Aquí tienes un ejemplo de código:
Espero que estos ejemplos de código te ayuden a comenzar con tus tareas. No dudes en comunicarte si tienes alguna otra pregunta.
¡Buena suerte con tu curso y tu viaje en Python!
Saludos cordiales,
Tu amigable experto en IT especializado en Python, Pandas, Pronósticos y Poisson.