in

Python | Pandas dataframe.groupby () – GeeksforGeeks

gfg 200x200 min

Python es un gran lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.

Pandas groupby se utiliza para agrupar los datos según las categorías y aplicar una función a las categorías. También ayuda a agregar datos de manera eficiente.

Pandas dataframe.groupby() La función se utiliza para dividir los datos en grupos según algunos criterios. Los objetos pandas se pueden dividir en cualquiera de sus ejes. La definición abstracta de agrupación es proporcionar un mapeo de etiquetas a nombres de grupos.

Sintaxis: DataFrame.groupby (by = None, axis = 0, level = None, as_index = True, sort = True, group_keys = True, squeeze = False, ** kwargs)

Parámetros:
por : mapeo, función, str o iterable
eje: int, predeterminado 0
nivel : Si el eje es un MultiIndex (jerárquico), agrupe por un nivel o niveles en particular
as_index: Para la salida agregada, devuelva el objeto con etiquetas de grupo como índice. Solo relevante para la entrada DataFrame. as_index = False es efectivamente salida agrupada «estilo SQL»
clasificar : Clasificar claves de grupo. Obtenga un mejor rendimiento desactivando esto. Tenga en cuenta que esto no influye en el orden de las observaciones dentro de cada grupo. groupby conserva el orden de las filas dentro de cada grupo.
teclas_grupo: Al llamar a aplicar, agregue claves de grupo al índice para identificar piezas
estrujar : Reduzca la dimensionalidad del tipo de retorno si es posible; de ​​lo contrario, devuelva un tipo coherente

Devoluciones : Objeto GroupBy

Para el enlace al archivo CSV utilizado en el código, haga clic en aquí

Ejemplo 1: Usar groupby() función para agrupar los datos en función del “Equipo”.

import pandas as pd

 

df = pd.read_csv("nba.csv")

 

df

1 506

Ahora aplique el groupby() función.

gk = df.groupby('Team')

 

gk.first()

Producción :
1 519

Imprimamos el valor contenido en cualquiera de los grupos. Para eso usa el nombre del equipo. Usamos la función get_group() para encontrar las entradas contenidas en cualquiera de los grupos.

gk.get_group('Boston Celtics')

Producción :
1 520

Ejemplo # 2: Usar groupby() función para formar grupos basados ​​en más de una categoría (es decir, utilizar más de una columna para realizar la división).

import pandas as pd

 

df = pd.read_csv("nba.csv")

 

gkk = df.groupby (['Team', 'Position'])

 

gkk.first()

Producción :
1 521

groupby() es una función muy poderosa con muchas variaciones. Hace que la tarea de dividir el marco de datos sobre algunos criterios sea realmente fácil y eficiente.

¡Atención geek! Fortalece tus cimientos con el Fundación de programación de Python Curso y aprende los conceptos básicos.

Para empezar, los preparativos de su entrevista Mejore sus conceptos de estructuras de datos con el Python DS Curso. Y para comenzar con su viaje de aprendizaje automático, únase al Aprendizaje automático – Curso de nivel básico

Deja una respuesta

Tu dirección de correo electrónico no será publicada.

apple touch icon@2

¿Cómo verifico qué versión de Python está ejecutando mi secuencia de comandos?

400px act sat preference

ACT vs SAT – Diferencia y comparación