1.Pandas小总结:
Series对象:1:创建:
importpandasaspd pd.Series(列表/元组/字典/ndarray对象/data=数据,index=索引)2:常用属性:Series对象名.index获取索引列、Series对象名.values获取值、Series对象名[索引] 获取指定索引的值、Series对象名[索引]=值 修改指定索引的值;
DataFrame对象:
1.Pandas数据结构和数据类型:
Pandas 是Python的第三方包,主要用于做 数据分析和统计处理;
核心对象:Series 列对象、DataFrame 二维表对象即多个Series组成;(pandas中没有行的概念,横着的Series最终也会以列的形式展示)
2. Series
Pandas中有两大核心对象,分别是: DataFrame和Series, 其中,Series 是一列数据,DataFrame 是多列数据;
2.1 创建Series对象:pd.Series(列表/元组/字典/ndarray对象/data=数据, index=索引)
1. 采用 默认自增索引创建Series对象:pd.Series(列表);
2. 采用 自定义索引创建Series对象:pd.Series(列表), index=列表(加个index属性);
3. 采用 字典,元组的形式创建Series对象:pd.Series(元组)、pd.Series(字典);
4. 采用 numpy的方式创建Series对象:pd.Series(np.arange(..))
importpandasaspdimportnumpyasnp# 1.创建Series对象,采用:默认自增索引s1=pd.Series([1,2,3,4,5])# 2.创建Series对象,采用:自定义索引s2=pd.Series([1,2,3,4,5],index=['a','b','c','d','e'])# 3.采用 元组 的形式 创建Series对象s3=pd.Series((1,2,3,4,5))#将方式一种的[]换成()# 3.采用 字典 的形式 创建Series对象s4=pd.Series({'a':1,'b':2,'c':3,'d':4,'e':5})# 4.使用numpy的方式创建Series对象s5=pd.Series(np.arange(5))# 5.使用data=数据, index=索引s6=pd.Series(data=[0,1,2,3,4,5],index=['A','B','C','D','E','F'])s6=pd.Series(data=[iforiinrange(6)],index=[iforiin'ABCDEF'])2.2 Series对象的常用属性:index、values、对象名[索引]、对象名[索引]=值
Series对象名.index:获取索引列; Series对象名.values:获取值;
Series对象名[索引]:获取指定索引的值;Series对象名[索引]=值:修改指定索引的值;
importpandasaspd# 1.构建Series对象,索引为:A-F,值为:0-5# s6 = pd.Series(data=[0, 1, 2, 3, 4, 5], index=['A', 'B', 'C', 'D', 'E', 'F'])#加入列表推导式s6=pd.Series(data=[iforiinrange(6)],index=[iforiin'ABCDEF'])#2.获取Series对象的 索引列(的值)print(s6.index)# Index(['A', 'B', 'C', 'D', 'E', 'F'], dtype='object')#3.获取Series对象的 值列(的值)print(s6.values)# [0 1 2 3 4 5]#4.Series支持根据 索引 获取元素,即:Series对象[索引值]print(s6['D'])#3#5.根据索引.修改Series对象的 元素值s6['D']=100print(s6.values)#[0 1 2 100 4 5]