Python学习笔记:pd.filter、query筛选数据

技术Python学习笔记:pd.filter、query筛选数据 Python学习笔记:pd.filter、query筛选数据一、pd.filter函数
1.介绍
pd.filter 函数根据指定的索引

计算机编程语言学习笔记:pd.filter、query筛选数据

一、pd.filter函数

1.介绍

pd.filter函数根据指定的索引标签对数据框行、或列进行数据筛选(子集查询)。

使用语法为:

数据框过滤器(项目=无,

像=无,-字符串

正则表达式=无,-字符串

轴=无)

类似于df.loc、df.iloc函数所实现的功能。

参数说明:

项目-对列进行筛选轴标签列表

regex -正则匹配

就像-进行筛选模糊名查询

轴=0 -按行

轴=1 -按列

注意:仅按照标签筛选,不对数据内容进行过滤!

2.pd.filter

# 构建测试集

进口熊猫作为螺纹中径

将numpy作为铭牌导入

df=pd .DataFrame(np.array(([1,2,3],[4,5,6])),

索引=['鼠标','兔子'],

列=['一','二','三'])

# 过滤列

df.filter(项目=['一','三'])

df.filter(['one'])

# 正则

df.filter(regex='e$ ',axis=1) #以e结尾

df.filter(regex='e$ ',axis=0)

df.filter(正则表达式='Q') #包含Q

# 相似

df.filter(如='bb ',轴=0) #按行

# 轴标签

df.filter(['一','二],轴=1)

# 混合使用

df.filter(regex='^r',轴=0)。过滤器(如='o ',轴=1) # r开头的行包含o的列

注意:其中的参数 items/like/regex 被强制执行为相互排斥,只能有一个存在。

3.pd.Series.filter

警局。系列应用过滤器时参数与df.filter一样,不过由于系列只有一个轴,不能将轴=1,只能按索引查询数据。

df.one.filter(['兔子'])

df.one.filter(如='e ')

df.one.filter(regex='e$ ')

4.DataFrameGroupBy.filter

分组后进行筛选,可以自定义函数,常与匿名函数希腊字母的第11个结合使用。

类似于结构化查询语言中的通过拥有操作。

使用语法为:

数据框架组副本。过滤器(func,dropna=True,*参数,**kwargs)

功能用于每个分组

dropna -是否删除

实操:

# 构建测试集

df=pd .DataFrame({'A' : ['foo ',' bar ',' foo ',' bar ',

foo ',' bar'],

B' : [1,2,3,4,5,6],

C' : [2.0,5 . 8. 1. 2. 9.]})

# 筛选分组后

df.groupby('A ').过滤器(lambda x:x['B'])。均值()3。)

# 长度

df.groupby("团队")。滤波器(x:透镜(x)=3)

# 只要有一个满足

df.groupby(['A']).过滤器(lambda x: (x['B'] 3).any())

# 全部满足

df.groupby('A ').过滤器(x :(x . mean()=4).all())

# 和满足

df.groupby('A ').滤波器(x : x Q1。总和(100)

二、pd.query函数

1.介绍

使用布尔表达式查询数据帧的列,按照某列规则进行过滤。

类似于结构化查询语言中的在哪里进行条件过滤。

使用语法为:

DataFrame.query(expr,inplace=False,**kwargs)

表达式查询字符串

就地-是否修改原数据框

2.实操

进口熊猫作为螺纹中径

将numpy作为铭牌导入

df=pd .DataFrame({'A':range(1,6),

b ' :范围(10,0,-2),

C':2})

df

'''

英国广播公司

0 1 10 2

1 2 8 2

2 3 6 2

3 4 4 2

4 5 2 2

'''

df.query('B==2') # B列等于2

df.query('A B') # A列小于B列

df[df .测向仪# B]#同上

# 多条件查询

df.query('A B A C ')

df.query('A B | A==4 ')

# 部分样例

df.query('A B C ')

df。查询(“a100”)

df.query('A==B ')

df.query('A!=100')

df。查询("[3,5]中的a”)

df.query('不在[3,5]中的a’)

df。查询(' name。字符串。包含(' r ')#好像不支持

df.name.str.contains('r') #测试没问题

df.query('B=='团队名称` ')#有空格反引号

注意:查询条件必须为字符串。

参考链接:熊猫过滤器筛选标签

参考链接:熊猫数据框.过滤器

参考链接:熊猫过滤器筛选标签

参考链接:熊猫过滤-过滤器函数,查询函数的使用

参考链接:熊猫-查询函数询问

参考链接:熊猫高级:查询方法教你优雅的查询

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/62062.html

(0)

相关推荐

  • Java数组中一维数组如何修改元素

    技术Java数组中一维数组如何修改元素这篇文章给大家分享的是有关Java数组中一维数组如何修改元素的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。/**
    修改scores数组索引index位

    攻略 2021年11月19日
  • mysql如何修改字段的值

    技术mysql如何修改字段的值本篇内容主要讲解“mysql如何修改字段的值”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“mysql如何修改字段的值”吧!

    攻略 2021年12月2日
  • 怎么进行spring源码解析

    技术怎么进行spring源码解析怎么进行spring源码解析,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。1、 依赖注入ICO:接管对象的创

    攻略 2021年11月12日
  • 如何用Python分析热门夺冠球队

    技术如何用Python分析热门夺冠球队如何用Python分析热门夺冠球队,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。2018年,火热的世界杯即将拉开序

    攻略 2021年10月29日
  • Eureka属性配置

    技术Eureka属性配置 Eureka属性配置一:Eureka Instance实例信息配置 里面的配置以"-"隔开 其实也支持驼峰命名代替"-"首先是入门时的配置:
    server: port: 80

    礼包 2021年10月28日
  • Win10下jdk安装及环境变量配置的方法是什么

    技术Win10下jdk安装及环境变量配置的方法是什么这篇文章主要讲解了“Win10下jdk安装及环境变量配置的方法是什么”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Wi

    攻略 2021年12月3日