案例一:给你一个字符串,s = 'hello kitty'
①1 输出函数:print(s.capitalize())
python系统提供了下面常用的函数:
① 数学库模块(math)提供了很多数学运算函数;
注意:在调用系统函数之前,先要使用import 语句导入 相应的模块
该语句将模块中定义的函数代码复制到自己的程 序中,然后就可以访问模块中的任何函数,其方 法是在函数名前面加上"模块名.".
希望能帮到你.
①.、print()函数:打印字符串;
①.0、s.sppace()函数:判断是否为空格;
①.1、str.replace()函数:替换字符;
............
all() enumerate() int() ord() str()
any() eval() isinstance() pow() sum()
basestring() execfile() issubclass() print() super()
bin() file() iter() property() tuple()
bool() filter() len() range() type()
bytearray() float() list() raw_input() unichr()
callable() format() locals() reduce() unicode()
chr() frozenset() long() reload() vars()
classmethod() getattr() map() repr() xrange()
cmp() globals() max() reverse() zip()
compile() hasattr() memoryview() round() __import__()
complex() hash() min() set()
delattr() help() next() setattr()
dict() hex() object() slice()
dir() id() oct() sorted()
python常见的内置函数有:
① abs()函数返回数字的绝对值.
①.0. dir()函数不带参数时,返回当前范围内的变量、方法和定义的类型列表;带参数时,返回参数的属性、方法列表.
扩展资料:
①.、首先先打开python自带的集成开发环境IDLE;
pandas官方文档:
对常用函数做了汇总,每个函数的参数可能不是全的,但是常用的,不常用的没总结,如有问题,请不吝赐教,谢谢!
①.、创建Series
? ? 通用函数:pd.Series(values,index)
? ? ? Series转字典:Series.to_dict()
? 说明:Series的values参数是python中常见的一维数据类型.
? ? ? ? Series的values是array类型
? ? ? ? 未指定index时,自动生成 0-(N-1)的整数索引,
? ? ? ? 指定 index时,使用指定索引.
? ? Series[0] / Series['a']? : Sereis可以位置索引或标签索引,也可以进行切片操作
①.、创建DataFrame
? 1) 创建DataFrame的通用函数:
? df = pd.DataFrame(values,index,columns)
说明:创建方法与Sries类似,Series的values参数是python中常见的一维数据类型,DataFrame的values参数是python中常见的二维数据类型.
? ? ? import webbrowser
? ? ? link = ''
? ? ? webbrowser.open(link)
? ? ? 打开界面进行复制,将数据复制到粘贴板中
? ? ? df = pd.read_clipboard() ? #从粘贴板中读取数据
? ? ? 自己总结:Series除了打印出来是Series格式外,其他时候可以直接当作list来操作.
? 1)df.columns
? ? ? 通过columns生成新的DataFrame
? 1)获取DataFrame某一列
? ? ? ? df.x1或df['x1']:返回值是Series,可以理解为一个DataFrame是由多个Series组成的.
? ? 1) df['x1'] = range(10)
? ? 说明:类似于创建Series
? ? for row in DataFrame.iterrows():
? ? ? ? ? ? print(row[0],row[1])
? ? df_new = df.T
①.、粘贴板的io
? ? df = pd.read_clipboard()
? ? df.to_clipboard()
? ? df.to_csv('xxx.csv')
? ? df = pd.read_csv('xxx.csv')
? ? df.to_json()
? ? pd.read_json(df.to_json())
? ? ? df.to_excel('xx.xlsx')
? ? ? df = pd.read_excel('xx.xlsx')
? ? ? df.to_sql('')
①.、iloc
? ? 说明:iloc函数是位置索引,与索引的名字无关.
? ? 将df重新索引,并且将NaN空值用10进行填充
? 前项填充,后面的值用前面的值进行填充
? 通过reindex想到,如果想新增一个空列或者空行,可以用reindex方法,同样地,想减少某些行或者某些列,也可以用reindex方法.
? ? 继reindex之后删除行列的函数操作
? ? Series.drop('A') ? #删除'A'所对应的值
? ? DataFrame.drop(label,axis)?
? ? label可以是行名也可以是列名,label是行的话axis是0,label是列的话axis是1.
? ** 删除行还可以用 del df['A']
nan是numpy的一种数据类型,np.nan,float类型
任何数据与nan的运算结果都是nan
①.、nan in Series
? ? Series.isnull()? --返回value为True或者False的Series
? ? Series.notnull()? --返回value为True或者False的Series
? ? Series.dropna()? --返回删除nan值后的Series
? ? Series.fillna(method='ffill')? --前项插值,按照前面的值填充后面的空值
? ? df.isnull()? --返回value为True或者False的DataFrame
? ? df.notnull()? --返回value为True或者False的DataFrame
? ? df.dropna(axis=0/1,how='any/all',thresh=None)
? ? 说明:axis表示删除行为nan或者列为nan;
? ? ? ? ? ? ? any表示只要有一个为空,all表示行中的每个元素或者列中的每个元素为空;
? ? ? ? ? ? ? thresh是阈值的意思,表示某行或者某列nan的个数达到阈值的个数时才删除该行或该列.
? ? df.fillna(value=1)? ---所有的空值都填充为1
? ? 注意:fillna和dropna的特点,生成新的DataFrame,原来的DataFrame不变.
①.、多重索引介绍
? Series['1']? --Series
? Series['1']['a']? --value
? df = Series.unstack() --转为二维DataFrame
①.、 map函数与apply函数、applymap函数的区别:
? ? 1)map函数对Series中的每个元素作用;
? df.sum()? --默认按照列进行求和,nan的值被忽略
? df.min()? --默认按照列求最小值
? df.max()? --默认按照列求最大值
? df.mean()? --默认按照列求平均值
? df.describe()? --默认按照列进行描述
? df.sum(axis=1)? --按行求和,nan的值被忽略
? #axis=0表示对横轴进行操作,但是运算中表现为纵轴操作
? #axis=1表示对纵轴进行操作,但是运算中表现为横轴操作
score_cat = pd.cut(Series,bins)? ---得到catgory类型的数据
DataFrame的分箱技术很棒啊!
--新增一列,将a列的值按照labels进行分类标记,good!!!
①.、按照一列分组
? ? g = df.groupby('city')
? ? g是分组类型数据,打印不出来,所以看不到,但是有属性和方法可以间接的了解
? 1) g.groups? --得到分的几个组,和每个组包含的索引
? ? ? ? g.mean()? --求每组的平均值
? ? ? ? g.max() ? --求每组的最大值
? ? ? ? g.min() ? --求每组的最小值
? ? ? ? g.count()
? ? ? ? g.describe()
? ? ? ? dict(list(g))? --将其转化为字典
? ? 同时可以通过for循环进行遍历操作:for item,desc in g:print(item,desc)
? ? #怪不得分组后不是DataFrame,因为元组的第一个元素是'分组名'.
? ? g_new = df.groupby(['city','wind'])
g.mean()? --求每组的平均值
与g.agg('mean')方法一样
pd.pivot_table(df,index=['',''],aggfuc='sum',values=['',''])
index是分组的组名,values是透视表呈现结果的列,columns是values下的分解
#感觉透视表呈现的结果就是groupby+agg后的结果
#分析者需要对数据结构有一定的了解
df.sort_values(by='',ascending=True/False)[:10]? df可以索引
df.value_counts()? --按值计数
df.['a'] = df['b'].apply(lambda x:x0)? --DataFrame中的True/False
通过g.size()可以看到被groupby之后的数据,得到的是一个Series
①.、Series的排序:
? 1)对值进行排序
? Series.sort_values()? ---直接对Series的值进行排序
? Series.sort_index()?
? #默认都是升序排列
? df.sort_values(by='')? --按照某列的顺序进行排序
? df['a'].sort_values()? --返回对a列数据的排序结果,只返回a列
①.、df.index = Series(['a','b','c'])? 直接对index赋予新值
? map函数中只传入新的函数名即可
? ? 或者传递字典,进行一一转换
? left:表示以左边的数据表为基准,进行填充右面的数据
? right:表示以右边的数据表为基准,填充左边的数据
? outer:以on的指定列的所有值为基准,填充两边的数据
? inner:默认inner,相同on指定的columns下的相同values对应的左右两边的数据
①.、concat拼接
? df['A'] = df['A'].apply(str.upper)? ---apply函数中也只输入函数名
? len(df)? --求df的长度
? len(df['a'].unique())? --查看a列中不重复数据的多少
? Series.duplicated()? --返回一列True/False的Series
? Series.drop_duplicates()? --删除重复值
? df.drop_duplicates('a',keep='first/last')
? df.drop_duplicates()? --删除完全重复的行
? 参数:'a'表示以a列为基准,删除重复值
? ? ? ? ? ? first表示保留第一个,last表示保留最后一个
? data_list = pd.date_range(start,end,period='D',freq)
? period='D',以天为单位
? freq = 'W' 以周为单位
? freq = 'W-Mon'以每周一位单位
? 以data_range作为索引提取数据比较简单
? 对时间序列数据进行分组聚合操作:
? s1.resample('M').mean()? --以月为单位进行采样,然后求每组的平均值
? s1.resample('H').ffill()? --前项填充
? s1.resample('H').bfill()? --后项填充
补充:1)jupyter中可以执行linux命令,太棒了!
? ? ? ? ? ? ? !ls
? ? ? ? ? ? ? !more xxx.csv
? ? ? ? ? ? ? !pwd? 等等
以上就是土嘎嘎小编为大家整理的python函数大全表相关主题介绍,如果您觉得小编更新的文章只要能对粉丝们有用,就是我们最大的鼓励和动力,不要忘记讲本站分享给您身边的朋友哦!!