Python学习笔记:pd.filter、query筛选数据

技术Python学习笔记:pd.filter、query筛选数据 Python学习笔记:pd.filter、query筛选数据一、pd.filter函数
1.介绍
pd.filter 函数根据指定的索引

计算机编程语言学习笔记:pd.filter、query筛选数据

一、pd.filter函数

1.介绍

pd.filter函数根据指定的索引标签对数据框行、或列进行数据筛选(子集查询)。

使用语法为:

数据框过滤器(项目=无,

像=无,-字符串

正则表达式=无,-字符串

轴=无)

类似于df.loc、df.iloc函数所实现的功能。

参数说明:

项目-对列进行筛选轴标签列表

regex -正则匹配

就像-进行筛选模糊名查询

轴=0 -按行

轴=1 -按列

注意:仅按照标签筛选,不对数据内容进行过滤!

2.pd.filter

# 构建测试集

进口熊猫作为螺纹中径

将numpy作为铭牌导入

df=pd .DataFrame(np.array(([1,2,3],[4,5,6])),

索引=['鼠标','兔子'],

列=['一','二','三'])

# 过滤列

df.filter(项目=['一','三'])

df.filter(['one'])

# 正则

df.filter(regex='e$ ',axis=1) #以e结尾

df.filter(regex='e$ ',axis=0)

df.filter(正则表达式='Q') #包含Q

# 相似

df.filter(如='bb ',轴=0) #按行

# 轴标签

df.filter(['一','二],轴=1)

# 混合使用

df.filter(regex='^r',轴=0)。过滤器(如='o ',轴=1) # r开头的行包含o的列

注意:其中的参数 items/like/regex 被强制执行为相互排斥,只能有一个存在。

3.pd.Series.filter

警局。系列应用过滤器时参数与df.filter一样,不过由于系列只有一个轴,不能将轴=1,只能按索引查询数据。

df.one.filter(['兔子'])

df.one.filter(如='e ')

df.one.filter(regex='e$ ')

4.DataFrameGroupBy.filter

分组后进行筛选,可以自定义函数,常与匿名函数希腊字母的第11个结合使用。

类似于结构化查询语言中的通过拥有操作。

使用语法为:

数据框架组副本。过滤器(func,dropna=True,*参数,**kwargs)

功能用于每个分组

dropna -是否删除

实操:

# 构建测试集

df=pd .DataFrame({'A' : ['foo ',' bar ',' foo ',' bar ',

foo ',' bar'],

B' : [1,2,3,4,5,6],

C' : [2.0,5 . 8. 1. 2. 9.]})

# 筛选分组后

df.groupby('A ').过滤器(lambda x:x['B'])。均值()3。)

# 长度

df.groupby("团队")。滤波器(x:透镜(x)=3)

# 只要有一个满足

df.groupby(['A']).过滤器(lambda x: (x['B'] 3).any())

# 全部满足

df.groupby('A ').过滤器(x :(x . mean()=4).all())

# 和满足

df.groupby('A ').滤波器(x : x Q1。总和(100)

二、pd.query函数

1.介绍

使用布尔表达式查询数据帧的列,按照某列规则进行过滤。

类似于结构化查询语言中的在哪里进行条件过滤。

使用语法为:

DataFrame.query(expr,inplace=False,**kwargs)

表达式查询字符串

就地-是否修改原数据框

2.实操

进口熊猫作为螺纹中径

将numpy作为铭牌导入

df=pd .DataFrame({'A':range(1,6),

b ' :范围(10,0,-2),

C':2})

df

'''

英国广播公司

0 1 10 2

1 2 8 2

2 3 6 2

3 4 4 2

4 5 2 2

'''

df.query('B==2') # B列等于2

df.query('A B') # A列小于B列

df[df .测向仪# B]#同上

# 多条件查询

df.query('A B A C ')

df.query('A B | A==4 ')

# 部分样例

df.query('A B C ')

df。查询(“a100”)

df.query('A==B ')

df.query('A!=100')

df。查询("[3,5]中的a”)

df.query('不在[3,5]中的a’)

df。查询(' name。字符串。包含(' r ')#好像不支持

df.name.str.contains('r') #测试没问题

df.query('B=='团队名称` ')#有空格反引号

注意:查询条件必须为字符串。

参考链接:熊猫过滤器筛选标签

参考链接:熊猫数据框.过滤器

参考链接:熊猫过滤器筛选标签

参考链接:熊猫过滤-过滤器函数,查询函数的使用

参考链接:熊猫-查询函数询问

参考链接:熊猫高级:查询方法教你优雅的查询

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/62062.html

(0)

相关推荐

  • Stream流

    技术Stream流 Stream流package com.mayikt.stream;import com.mayikt.entity.UserEntity;import java.util.Array

    礼包 2021年11月24日
  • TensorRT——INT8推理

    技术TensorRT——INT8推理 TensorRT——INT8推理原理为什么要使用INT8推理:更高的吞吐量/处理的fps提高以及更低的内存占用(8-bit vs 32-bit)
    将FP32模型转换

    礼包 2021年11月12日
  • 美国服务器搭建游戏服务端有什么好USA-IDC

    技术美国服务器搭建游戏服务端有什么好USA-IDC通过服务器设置,您可以将其视为更像是为其玩家托管视频游戏的远程计算机。由于美国服务器不在游戏引擎上运行,因此它需要使用上述图形卡那样呈现任何内容。然而,它的作用是指示客户

    礼包 2021年12月23日
  • 君越怎么样,君越的优点和缺点是什么

    技术君越怎么样,君越的优点和缺点是什么展开全部 1、车体宽大君越怎么样,大气,外形给人一种豪华上档次的感觉。 2、有全新四缸全铝发动机,据说油耗在6.2升/100公里/90公里等速,如果能真的达到这个标准,我感觉应该非

    生活 2021年10月25日
  • 怎么使用JavaScript异步操作中串行和并行

    技术怎么使用JavaScript异步操作中串行和并行这篇文章主要讲解了“怎么使用JavaScript异步操作中串行和并行”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么

    攻略 2021年11月19日
  • 简单平面图怎么画,ppt怎么做简单的平面图

    技术简单平面图怎么画,ppt怎么做简单的平面图1/7
    第一步:在PPT2010中,单击“插入”选项卡,在“插图”组中单击“形状”按钮,在弹出的下拉面板中选择“线条”中的“箭头”,在PPT编辑区按着shift键用鼠标横向拖

    生活 2021年10月30日