网站首页 > 文章中心 > 其它

python重置索引函数_python中capitalize函数

作者:小编 更新时间:2023-10-16 07:42:19 浏览量:184人看过

index在python中的用法

如下:

①.、index函数:用于从列表中找出某个值第一个匹配项的索引位置.

python中index函数怎么用?

Python中index方法检测字符串中是否包含子字符串 str ,如果指定 beg(开始) 和 end(结束) 范围,则检查是否包含在指定范围内,该方法与 python find方法一样,只不过如果str不在string中会报一个异常.

index函数一般用处是在序列中检索参数并返回第一次出现的索引,没找到就会报错.

Python 数据处理(二十四)—— 索引和选择

这也可以用 .iloc 获取,通过使用位置索引来选择内容

python重置索引函数_python中capitalize函数-图1

可以使用 .get_indexer 获取多个索引:

警告 :

对于包含一个或多个缺失标签的列表,使用 .loc 或 [] 将不再重新索引,而是使用 .reindex

在以前的版本中,只要索引列表中存在至少一个有效标签,就可以使用 .loc[list-of-labels]

但是现在,只要索引列表中存在缺失的标签将引发 KeyError .推荐的替代方法是使用 .reindex() .

例如

索引列表的标签都存在

python重置索引函数_python中capitalize函数-图2

先前的版本

但是,现在

索引标签列表中包含不存在的标签,使用 reindex

另外,如果你只想选择有效的键,可以使用下面的方法,同时保留了数据的 dtype

对于 .reindex() ,如果有重复的索引将会引发异常

通常,您可以将所需的标签与当前轴做交集,然后重新索引

但是,如果你的索引结果包含重复标签,还是会引发异常

使用 sample() 方法可以从 Series 或 DataFrame 中随机选择行或列.

该方法默认会对行进行采样,并接受一个特定的行数、列数,或数据子集.

默认情况下, sample 每行最多返回一次,但也可以使用 replace 参数进行替换采样

默认情况下,每一行被选中的概率相等,但是如果你想让每一行有不同的概率,你可以为 sample 函数的 weights 参数设置抽样权值

这些权重可以是一个列表、一个 NumPy 数组或一个 Series ,但它们的长度必须与你要抽样的对象相同.

缺失的值将被视为权重为零,并且不允许使用 inf 值.如果权重之和不等于 1 ,则将所有权重除以权重之和,将其重新归一化.例如

当应用于 DataFrame 时,您可以通过简单地将列名作为字符串传递给 weights 作为采样权重(前提是您要采样的是行而不是列).

sample 还允许用户使用 axis 参数对列进行抽样.

最后,我们还可以使用 random_state 参数为 sample 的随机数生成器设置一个种子,它将接受一个整数(作为种子)或一个 NumPy RandomState 对象

当为该轴设置一个不存在的键时, .loc/[] 操作可以执行放大

在 Series 的情况下,这实际上是一个追加操作

可以通过 .loc 在任一轴上放大 DataFrame

这就像 DataFrame 的 append 操作

由于用 [] 做索引必须处理很多情况(单标签访问、分片、布尔索引等),所以需要一些开销来搞清楚你的意图

如果你只想访问一个标量值,最快的方法是使用 at 和 iat 方法,这两个方法在所有的数据结构上都实现了

与 loc 类似, at 提供了基于标签的标量查找,而 iat 提供了基于整数的查找,与 iloc 类似

同时,你也可以根据这些索引进行设置值

如果索引标签不存在,会放大数据

另一种常见的操作是使用布尔向量来过滤数据.运算符包括:

|(or) 、 (and) 、 ~ (not)

使用一个布尔向量来索引一个 Series ,其工作原理和 NumPy ndarray 一样.

您可以使用一个与 DataFrame 的索引长度相同的布尔向量从 DataFrame 中选择行

列表推导式和 Series 的 map 函数可用于产生更复杂的标准

我们可以使用布尔向量结合其他索引表达式,在多个轴上索引

iloc 支持两种布尔索引.如果索引器是一个布尔值 Series ,就会引发异常.

例如,在下面的例子中, df.iloc[s.values, 1] 是正确的.但是 df.iloc[s,1] 会引发 ValueError .

Python其实很简单 第十九章 Pandas之Series与DataFrame

Anaconda是Python的一个开源发行版本,它预装了丰富的第三方库,而且主要面向科学计算和数据分析,使用起来要比原版的Python更省时省力.

安装Anaconda之后,就会发现在Anaconda目录下同时安装了Jupyter Notebook、Spyder等工具,我们此时此刻呢主要使用Spyder进行开发.关于Spyder的使用方法非常简单,大家也可以去网上搜索学习.

虽然Anaconda已经预装了很多常用的包,但有时我们也需要自己安装一些包.可以在开始菜单中选择"Anaconda Anaconda Prompt"命令,在命令行输入conda install ( 代表包名)即可安装,也可以输入pip install .

Pandas是Python的一个数据分析包,Anaconda安装时已经附带安装了Pandas包.

Pandas数据结构有三种:Series(一维数组)、DataFrame(二维数组)和Panel(三维数组),其中最常用的是前两种数据结构.

Series(序列)用于存储一行或一列数据,以及与之相关的索引的集合.

语法格式如下:

例:

from pandas import Series

print(s)

输出结果如下:

①. 张三

dtype: object

上面建立序列时指定了索引,若不指定,则默认的索引值从0开始.如下:

s=Series(['张三','李四','王五'])

输出结果为:

0 张三

①. 李四

索引值也可以为字符串.如下:

s=Series(['张三','李四','王五'],index=['A','B','C'])

输出结果为:

A 张三

B 李四

C 王五

①.、访问序列

(1)可以通过索引访问序列,如:

print(s[0])

print(s[1:])

运行结果如下:

dtype: object #print(s)输出

张三 #print(s[0])输出

dtype: object #print(s[1:])输出

print(s.index[s.values=='李四'])

运行结果:

Index(['B'], dtype='object')

f='李四' in s.values

print(f)

True

s=Series(['张三','李四','王五','孙六'],index=['A','B','C','D'])

(1)追加序列,如:

s1=Series(['孙六'],index=['D'])

s=s.append(s1)

D 孙六

s[1]='李飞'

B 李飞

不知道索引,仅知道要修改的值,也可通过值查找到索引后,再修改序列的值.如:

s[s.index[s.values=='李四']]='李飞'

这样也可以将"李四"修改为"李飞.

s=s.drop('A')

可以按照索引排序,使用sort_index(ascending=True)方法对index进行排序操作.

s=s.sort_index(ascending=False) # ascending=False表示按降序排列

重置索引可以使用reindex().如果index列表中的元素多于序列的值,可用fill_value=0这样的语句填充.

s=s.reindex(['D','C','B','A'])

如果index列表中的元素多于序列的值,可用fill_value=0这样的语句填充.

s=s.reindex(['D','C','B','A'], fill_value=0)

DataFrame(数据框架)用于存储多行和多列的数据集合.它是Series的容器,类似于Excel中二维表格.

定义一个DataFrame的语法格式如下:

例如,有如下二维表:

姓名

性别

python重置索引函数_python中capitalize函数-图3

年龄

张三

李四

王五

保存到DataFrame中可以用如下方法:

from pandas import DataFrame

name=Series(['张三','李四','王五'])

sex=Series(['男','女','男'])

df=DataFrame({'姓名':name,'性别':sex,'年龄':age})

print(df)

姓名 性别 年龄

从上例可以看出,虽然我们省缺了索引,但系统自动添加了从0开始的索引值.

①.、访问方式

(1)获取行

输出结果:

print(df['姓名']) #获取"姓名"列的值

Name: 姓名, dtype: object

另一种方法:

print(df[df.columns[0:1]]) #先按照索引号获取列名,再按照列名读取

输出结果和上面的方法完全一致.

还有一种情况,是获取唯一值,即将列内的重复值中多余的删除,仅留下互不相同的值.所用的到方法是unique().

sex1=Series(df['性别'].unique())

print(sex1)

0 男

①. 女

print(df.at[1,'姓名']) # 格式为变量名.at[行号,列名]

性别 年龄

(1)修改列名

print(df.columns)

df.columns=['name','sex','age']

Index(['姓名', '性别', '年龄'], dtype='object')

Index(['name', 'sex', 'age'], dtype='object')

可见,列名已经由"姓名、性别、年龄"修改为"age、sex、age"了.但这种修改必须把全部列名都一一列举,不能有遗漏,否则就会出错.如:

df.columns=['name','sex']

df.drop(1,axis=0) # axis=0表示行轴,也可以省略

df.drop('性别',axis=1) # axis=0表示列轴

也可以使用另一种方法:

del df['性别']

姓名 性别 年龄 电话

df=DataFrame({'姓名':name,'性别':sex,'年龄':age}) # 建立DataFrame,变量名为df

name1=Series(['孙六','候七'])

sex1=Series(['男','女'])

df1=DataFrame({'姓名':name1,'性别':sex1,'年龄':age1})

# 建立DataFrame,变量名为df1

df=df.append(df1,ignore_index=True)

# 将对df1追加到df后面,参数ignore_index=True表示重新索引

以上就是土嘎嘎小编为大家整理的python重置索引函数相关主题介绍,如果您觉得小编更新的文章只要能对粉丝们有用,就是我们最大的鼓励和动力,不要忘记讲本站分享给您身边的朋友哦!!

版权声明:倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本站《原创》内容,违者将追究其法律责任。本站文章内容,部分图片来源于网络,如有侵权,请联系我们修改或者删除处理。

编辑推荐

热门文章