Python学习笔记:pd.filter、query筛选数据

技术Python学习笔记:pd.filter、query筛选数据 Python学习笔记:pd.filter、query筛选数据一、pd.filter函数
1.介绍
pd.filter 函数根据指定的索引

计算机编程语言学习笔记:pd.filter、query筛选数据

一、pd.filter函数

1.介绍

pd.filter函数根据指定的索引标签对数据框行、或列进行数据筛选(子集查询)。

使用语法为:

数据框过滤器(项目=无,

像=无,-字符串

正则表达式=无,-字符串

轴=无)

类似于df.loc、df.iloc函数所实现的功能。

参数说明:

项目-对列进行筛选轴标签列表

regex -正则匹配

就像-进行筛选模糊名查询

轴=0 -按行

轴=1 -按列

注意:仅按照标签筛选,不对数据内容进行过滤!

2.pd.filter

# 构建测试集

进口熊猫作为螺纹中径

将numpy作为铭牌导入

df=pd .DataFrame(np.array(([1,2,3],[4,5,6])),

索引=['鼠标','兔子'],

列=['一','二','三'])

# 过滤列

df.filter(项目=['一','三'])

df.filter(['one'])

# 正则

df.filter(regex='e$ ',axis=1) #以e结尾

df.filter(regex='e$ ',axis=0)

df.filter(正则表达式='Q') #包含Q

# 相似

df.filter(如='bb ',轴=0) #按行

# 轴标签

df.filter(['一','二],轴=1)

# 混合使用

df.filter(regex='^r',轴=0)。过滤器(如='o ',轴=1) # r开头的行包含o的列

注意:其中的参数 items/like/regex 被强制执行为相互排斥,只能有一个存在。

3.pd.Series.filter

警局。系列应用过滤器时参数与df.filter一样,不过由于系列只有一个轴,不能将轴=1,只能按索引查询数据。

df.one.filter(['兔子'])

df.one.filter(如='e ')

df.one.filter(regex='e$ ')

4.DataFrameGroupBy.filter

分组后进行筛选,可以自定义函数,常与匿名函数希腊字母的第11个结合使用。

类似于结构化查询语言中的通过拥有操作。

使用语法为:

数据框架组副本。过滤器(func,dropna=True,*参数,**kwargs)

功能用于每个分组

dropna -是否删除

实操:

# 构建测试集

df=pd .DataFrame({'A' : ['foo ',' bar ',' foo ',' bar ',

foo ',' bar'],

B' : [1,2,3,4,5,6],

C' : [2.0,5 . 8. 1. 2. 9.]})

# 筛选分组后

df.groupby('A ').过滤器(lambda x:x['B'])。均值()3。)

# 长度

df.groupby("团队")。滤波器(x:透镜(x)=3)

# 只要有一个满足

df.groupby(['A']).过滤器(lambda x: (x['B'] 3).any())

# 全部满足

df.groupby('A ').过滤器(x :(x . mean()=4).all())

# 和满足

df.groupby('A ').滤波器(x : x Q1。总和(100)

二、pd.query函数

1.介绍

使用布尔表达式查询数据帧的列,按照某列规则进行过滤。

类似于结构化查询语言中的在哪里进行条件过滤。

使用语法为:

DataFrame.query(expr,inplace=False,**kwargs)

表达式查询字符串

就地-是否修改原数据框

2.实操

进口熊猫作为螺纹中径

将numpy作为铭牌导入

df=pd .DataFrame({'A':range(1,6),

b ' :范围(10,0,-2),

C':2})

df

'''

英国广播公司

0 1 10 2

1 2 8 2

2 3 6 2

3 4 4 2

4 5 2 2

'''

df.query('B==2') # B列等于2

df.query('A B') # A列小于B列

df[df .测向仪# B]#同上

# 多条件查询

df.query('A B A C ')

df.query('A B | A==4 ')

# 部分样例

df.query('A B C ')

df。查询(“a100”)

df.query('A==B ')

df.query('A!=100')

df。查询("[3,5]中的a”)

df.query('不在[3,5]中的a’)

df。查询(' name。字符串。包含(' r ')#好像不支持

df.name.str.contains('r') #测试没问题

df.query('B=='团队名称` ')#有空格反引号

注意:查询条件必须为字符串。

参考链接:熊猫过滤器筛选标签

参考链接:熊猫数据框.过滤器

参考链接:熊猫过滤器筛选标签

参考链接:熊猫过滤-过滤器函数,查询函数的使用

参考链接:熊猫-查询函数询问

参考链接:熊猫高级:查询方法教你优雅的查询

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/62062.html

(0)

相关推荐

  • jmeter中时间戳函数怎么用

    技术jmeter中时间戳函数怎么用这篇文章主要介绍了jmeter中时间戳函数怎么用,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。在使用jmeter做接口测

    攻略 2021年11月30日
  • javascrip高级前端开发常用的API有哪些

    技术javascrip高级前端开发常用的API有哪些这篇文章主要介绍“javascrip高级前端开发常用的API有哪些”,在日常操作中,相信很多人在javascrip高级前端开发常用的API有哪些问题上存在疑惑,小编查阅

    攻略 2021年11月26日
  • 如何浅析客舱服务开题报告(如何浅析以前文学作品)

    技术如何浅析Go-To-Market本篇文章给大家分享的是有关如何浅析Go-To-Market,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。Go-To-Ma

    攻略 2021年12月18日
  • 衣补旁,衣补旁和四补旁有什么区别

    技术衣补旁,衣补旁和四补旁有什么区别一衣补旁、笔画数不同 1、四补旁:礻为示字旁,笔画数为四笔。 2、衣补旁:衤为衣字旁,笔画数为五笔。
    二、来源不同
    1、四补旁:同“示”。用作偏旁。俗称“示字旁”。
    2、衣补旁:

    生活 2021年10月24日
  • css盒子溢出的所有内容隐藏(css对图片设置隐藏左边部分)

    技术css如何设置图片放大后隐藏溢出这篇文章主要介绍“css如何设置图片放大后隐藏溢出”,在日常操作中,相信很多人在css如何设置图片放大后隐藏溢出问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家

    攻略 2021年12月13日
  • Centos6、7操作系统中怎么开启或关闭ICMP协议

    技术Centos6、7操作系统中怎么开启或关闭ICMP协议小编给大家分享一下Centos6、7操作系统中怎么开启或关闭ICMP协议,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有

    攻略 2021年11月15日