in

Formas de filtrar Pandas DataFrame por valores de columna

gfg 200x200 min

En esta publicación, veremos diferentes formas de filtrar Pandas Dataframe por valores de columna. Primero, creemos un marco de datos:

Python3

import pandas as pd 

   

record =

 

 'Name' : ['Ankit', 'Swapnil', 'Aishwarya'

          'Priyanka', 'Shivangi', 'Shaurya' ],

   

 'Age' : [22, 20, 21, 19, 18, 22],

   

 'Stream' : ['Math', 'Commerce', 'Science'

            'Math', 'Math', 'Science'],

   

 'Percentage' : [90, 90, 96, 75, 70, 80] }

   

dataframe = pd.DataFrame(record,

                         columns = ['Name', 'Age'

                                    'Stream', 'Percentage'])

print("Given Dataframe :n", dataframe)

Producción:

Marco de datos

Método 1: Seleccionar filas de Pandas Dataframe en función de un valor de columna particular usando el operador ‘>’, ‘=’, ‘=’, ‘

Ejemplo 1: Seleccionando todas las filas del marco de datos dado en el que ‘Porcentaje’ es mayor que 75 usando [ ].

Python3

rslt_df = marco de datos[dataframe['Percentage'] > 70

   

print('nResult dataframe :n', rslt_df)

Producción:

marco de datos de salida

Ejemplo 2: Seleccionando todas las filas del marco de datos dado en el que ‘Porcentaje’ es mayor que 70 usando loc[ ].

Python3

rslt_df = dataframe.loc[dataframe['Percentage'] > 70

   

print('nResult dataframe :n'

      rslt_df)

Producción:

dataframe-1 de salida

Método 2: Seleccionando aquellas filas de Pandas Dataframe cuyo valor de columna está presente en la lista usando el método isin () del marco de datos.

Ejemplo 1: Seleccionar todas las filas del marco de datos dado en el que ‘Stream’ está presente en la lista de opciones usando [ ].

Python3

options = ['Science', 'Commerce']

   

rslt_df = marco de datos[dataframe['Stream'].isin (opciones)]

   

print('nResult dataframe :n',

      rslt_df)

Producción:

dataframe-2 de salida

Ejemplo 2: Seleccionar todas las filas del marco de datos dado en el que ‘Stream’ está presente en la lista de opciones usando loc[ ].

Pitón

options = ['Science', 'Commerce']

   

rslt_df = dataframe.loc[dataframe['Stream'].isin (opciones)]

   

print('nResult dataframe :n'

      rslt_df)

Producción:

dataframe-3 de salida

Método 3: Seleccionar filas de Pandas Dataframe en función de las condiciones de varias columnas mediante el operador ‘&’.

Ejemplo 1: Seleccionando todas las filas del marco de datos dado en el que ‘Edad’ es igual a 22 y ‘Stream’ está presente en la lista de opciones usando [ ].

Python3

options = ['Commerce' ,'Science']

   

rslt_df = marco de datos[(dataframe['Age'] == 22) & 

          marco de datos['Stream'].isin (opciones)]

   

print('nResult dataframe :n',

      rslt_df)

Producción:

dataframe-4 de salida

Ejemplo 2: Seleccionando todas las filas del marco de datos dado en el que ‘Edad’ es igual a 22 y ‘Stream’ está presente en la lista de opciones usando loc[ ].

Python3

options = ['Commerce', 'Science']

  

rslt_df = dataframe.loc[(dataframe['Age'] == 22) & 

              marco de datos['Stream'].isin (opciones)]

   

print('nResult dataframe :n',

      rslt_df)

Producción:

dataframe-5 de salida

¡Atención geek! Fortalece tus cimientos con el Fundación de programación de Python Curso y aprende los conceptos básicos.

Para empezar, los preparativos de su entrevista Mejore sus conceptos de estructuras de datos con el Python DS Curso. Y para comenzar con su viaje de aprendizaje automático, únase al Aprendizaje automático – Curso de nivel básico

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

apple touch icon@2

python – Error de importación: ningún módulo llamado numpy

edit

Andragogía vs Pedagogía – Diferencia y Comparación