Python es un gran lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
Pandas groupby se utiliza para agrupar los datos según las categorías y aplicar una función a las categorías. También ayuda a agregar datos de manera eficiente.
Pandas dataframe.groupby()
La función se utiliza para dividir los datos en grupos según algunos criterios. Los objetos pandas se pueden dividir en cualquiera de sus ejes. La definición abstracta de agrupación es proporcionar un mapeo de etiquetas a nombres de grupos.
Sintaxis: DataFrame.groupby (by = None, axis = 0, level = None, as_index = True, sort = True, group_keys = True, squeeze = False, ** kwargs)
Parámetros:
por : mapeo, función, str o iterable
eje: int, predeterminado 0
nivel : Si el eje es un MultiIndex (jerárquico), agrupe por un nivel o niveles en particular
as_index: Para la salida agregada, devuelva el objeto con etiquetas de grupo como índice. Solo relevante para la entrada DataFrame. as_index = False es efectivamente salida agrupada «estilo SQL»
clasificar : Clasificar claves de grupo. Obtenga un mejor rendimiento desactivando esto. Tenga en cuenta que esto no influye en el orden de las observaciones dentro de cada grupo. groupby conserva el orden de las filas dentro de cada grupo.
teclas_grupo: Al llamar a aplicar, agregue claves de grupo al índice para identificar piezas
estrujar : Reduzca la dimensionalidad del tipo de retorno si es posible; de lo contrario, devuelva un tipo coherenteDevoluciones : Objeto GroupBy
Para el enlace al archivo CSV utilizado en el código, haga clic en aquí
Ejemplo 1: Usar groupby()
función para agrupar los datos en función del “Equipo”.
|
Ahora aplique el groupby()
función.
|
Producción :
Imprimamos el valor contenido en cualquiera de los grupos. Para eso usa el nombre del equipo. Usamos la función get_group()
para encontrar las entradas contenidas en cualquiera de los grupos.
|
Producción :
Ejemplo # 2: Usar groupby()
función para formar grupos basados en más de una categoría (es decir, utilizar más de una columna para realizar la división).
|
Producción :
groupby()
es una función muy poderosa con muchas variaciones. Hace que la tarea de dividir el marco de datos sobre algunos criterios sea realmente fácil y eficiente.
¡Atención geek! Fortalece tus cimientos con el Fundación de programación de Python Curso y aprende los conceptos básicos.
Para empezar, los preparativos de su entrevista Mejore sus conceptos de estructuras de datos con el Python DS Curso. Y para comenzar con su viaje de aprendizaje automático, únase al Aprendizaje automático – Curso de nivel básico