in

Los 4 mejores repositorios en GitHub para aprender pandas

1i88V5Dgi0kPa J2JyUIPfA

PROGRAMACIÓN

Los 4 mejores repositorios en GitHub para aprender pandas

Algunos de los repositorios más populares para repasar Pandas tanto para principiantes como para expertos.

Byron Dolon

21 de julio de 2020·5 min de lectura

Todo el mundo sabe qué es Github.

Si eres un novato como yo, es posible que todavía tengas miedo de tocarlo. Si bien realmente no he progresado más allá git commit + git push, Sé que puedes usar Github como más que una herramienta de control de versiones para tus proyectos.

Además de los proyectos de código abierto con los que cualquiera puede comprometerse, Github también tiene innumerables recursos que puede usar como material de aprendizaje.

Mientras sigue un correo en líneasPuede ser excelente, a veces tener práctica adicional puede ayudarlo a retener mejor lo que aprendió anteriormente. Los sitios populares «Codewars» y «Codekata» son una forma de obtener práctica adicional todos los días, ya que puede seleccionar un idioma de su elección y resolver tantos problemas como desee.

Para aquellos de ustedes que buscan específicamente la práctica de Pandas, pueden beneficiarse de esta lista de ¡Los 4 mejores repositorios en GitHub para Pandas! Hay un repositorio para cada nivel, ya sea que acabe de comenzar con Pandas o si ya está buscando llevar sus habilidades de básico a avanzado. He incluido los que tienen más bifurcaciones como medida de popularidad.

Ejercicios de pandas: todos los temas (bifurcaciones 4k)

Este repositorio tiene 11 secciones diferentes con ejercicios desde obtener datos en un DataFrame hasta crear visualizaciones avanzadas. Cada carpeta tiene varios conjuntos de datos, que tienen diferentes ejercicios.

Puede descargar los archivos IPYNB para abrir los cuadernos de Jupyter y probar los ejercicios usted mismo. Hay celdas vacías debajo de cada pregunta, por lo que puede ingresar su código y luego verificar sus respuestas mirando el archivo «Exercise_with_Solution.ipynb».

Hay un total de 27 cuadernos para revisar, por lo que este es definitivamente un recurso completo. Incluso si ya está familiarizado con Pandas, vale la pena pasar por la sección «Obtener y conocer», porque puede encontrar funciones como .describe(include=all) y .nunique() que no has visto antes.

También hay un enlace a videos de científicos de datos que revisan todos los cuadernos, por lo que si prefiere ver un tutorial de las soluciones en lugar de simplemente leerlas, puede verificarlo aquí.

guipsamora / pandas_exercises

Harto de un montón de tutoriales pero sin una forma fácil de encontrar ejercicios, decidí crear un repositorio solo con ejercicios para …

github.com

Videos de Pandas – Todos los temas con videos (1.2k Forks)

Este repositorio contiene cuadernos de Jupyter con código de una serie de videos que pasa por muchas funciones de Pandas diferentes. El autor explica cómo resolver una pregunta utilizando un conjunto de datos real (el autor lo ha publicado en línea y está incluido en el cuaderno).

Lo ideal sería tener un cuaderno de Jupyter abierto y seguir el video. Luego, una vez que haya terminado con el video y haya revisado todo el código, puede usar los cuadernos incluidos en el repositorio como hoja de respuestas. También hay algunas notas a pie de página adicionales en los cuadernos que pueden ayudar a aclarar la salida de ciertas celdas.

Esta lista de videos y cuadernos asociados es muy completa, por lo que lo más probable es que si tiene una pregunta relacionada con Pandas, encontrará un tutorial aquí. Hay preguntas simples y de nicho como «¿Cómo clasifico un DataFrame o Serie de Pandas?» Y preguntas amplias y complejas como «¿Cómo uso los pandas con sci-kit? Aprenda a crear presentaciones de Kaggle».

justmarkham / pandas-videos

Cuaderno Jupyter y conjuntos de datos de la serie de videos de preguntas y respuestas de pandas – justmarkham / pandas-videos

github.com

100 Pandas Puzzles (1k tenedores)

Este repositorio tiene solo un cuaderno de Jupyter para que lo descargues con todos los ejercicios. Cada pregunta tiene una celda debajo donde puede completar su código, que puede verificar con la celda correspondiente en el cuaderno de soluciones.

El cuaderno está dividido en diferentes secciones como «Importación de pandas», «Conceptos básicos de DataFrame», «Series y DatetimeIndex», etc. Descubrirá que la mayoría de las preguntas se pueden resolver con solo un par de líneas, por lo que, idealmente, no tendrá bloques gigantes de código para una sola pregunta.

También hay una sección interesante «Buscaminas», donde:

Haremos un DataFrame que contiene los datos necesarios para un juego de Buscaminas: coordenadas de los cuadrados, si el cuadrado contiene una mina y el número de minas que se encuentran en los cuadrados adyacentes.

Está categorizado como «medio a difícil» en dificultad, pero si ha pasado por los ejercicios anteriores, debería poder hacerlo. Pensé que era un descanso divertido del análisis de datos tradicional, ya que te obliga a pensar en cómo manipular un DataFrame en una situación única.

El autor también señala que la lista de acertijos no está completa, por lo que si también desea contribuir a la lista de acertijos, puede enviar solicitudes de ejercicios adicionales, correcciones y mejoras.

ajcr / 100-pandas-puzzles

Inspirado en 100 ejercicios de Numpy, aquí hay 100 * rompecabezas cortos para poner a prueba su conocimiento del poder de los pandas. Desde pandas …

github.com

Tutorial de Pycon 2019 – Nivel intermedio (180 tenedores)

Este repositorio incluye un cuaderno (muy largo) con el código discutido en el video “Mejores prácticas de ciencia de datos con Pandas” producido por el autor. Es mejor para usuarios intermedios de Pandas, ya que no incluye un tutorial de los conceptos básicos de Pandas.

Hay ocho secciones principales, que en realidad no siguen un formato de tipo “tutorial”. En cambio, el cuaderno se lee como un proyecto de análisis de datos real, desde examinar los datos hasta limpiarlos, crear visualizaciones preliminares y responder preguntas específicas como «¿Qué ocupaciones ofrecen las charlas TED más divertidas en promedio?».

Si es nuevo en los proyectos de análisis de datos con Python y Pandas, puede valer la pena leer todo el video para ver cómo alguien abordaría los diferentes pasos de limpieza, exploración y análisis. Luego, podría aplicar esas mejores prácticas en sus propios proyectos.

justmarkham / pycon-2019-tutorial

Este tutorial fue presentado por Kevin Markham en PyCon el 2 de mayo de 2019. Vea el video tutorial completo en YouTube. Los…

github.com

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

abrir ubicacion del Lol

¿Cómo cambiar el idioma en LOL – League of Legends y ponerlo en español? Guía paso por paso

bullet

Esquemas de estrellas y copos de nieve