数据计算和分析
一、Numpy(科学计算)
1、概述
1、概念
?Numpy是一个专门用于矩阵运算和科学计算的开源Python。
?NumPy将Python变成了一个自由且功能更强大的Matlab系统。
?1.强大的数组多维数组结构
?2.成熟的函数库
?3.集成C/C和Fortran代码的工具包
?4.线性代数、傅立叶变换和随机数的实用模块
?5.Numpy和稀疏矩阵运算包scipy一起使用非常方便。
2、基本数据结构
矩阵表示:使用Numpy,很容易得到二维矩阵。
由于n array对象中的数据有时不是必需的,因此可以使用n array对象的astype()方法将其转换为指定的数据类型。
2、使用
1、加载包
使用jupyter
只运行当前行,不从头到尾。
新建文件夹开始使用
2、索引
在数据被转换成一个数组对象后,有必要以某种方式提取数据。
Ndarray对象提供三种索引方法:
1、切片索引:切片索引和对列表list的切片索引相似,不过由原本的一维切片变为多维
2、下标索引,看成xy轴,通过坐标点获取
3、布尔值索引
二、Pandas(数据分析)
1、概念
熊猫提供了大量的数据结构和功能,使我们能够快速方便地处理结构化数据。
Pandas将NumPy的高性能数组计算功能与电子表格和关系数据库的灵活数据处理功能相结合。
2、使用
1、导包
2、Series
Series是一个类似于一维数组的对象,由数据(各种NumPy数据类型)和相关数据标签(即索引)组成。
系列对象可以通过字典建立,系列对象的索引也可以修改。
3、Dataframe
DataFrame是一种表格数据结构,它包含一组有序的列,每个列可以是不同的值类型(数值、字符串、布尔值等)。).
DataFrame既有行索引,也有列索引,可以看作是由Series组成的字典。
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/146461.html