通过例子来说明sorted的用法:?
①?对由tuple组成的List排序?
Python代码?
用key函数排序(lambda的用法见?注释1)?
用cmp函数排序?
from?operator?import?itemgetter,?attrgetter?
用?operator?函数进行多级排序?
sorted(d.iteritems(),?key=itemgetter(1),?reverse=True)?
python内置关于排序的工具主要有两个一个是列表自带的 sort() 方法,另外一个是 sorted() 函数.Python 列表内置方法可以直接修改列表.而 sorted() 内置函数从一个可迭代对象(列表,元组等都可以)构建一个新的排序列表.其函数原型分别如下:
对列表进行默认排序
从函数原型来看,可以看到两者都具有两个可选参数,它们都必须指定为关键字参数.
key 指定带有单个参数的函数,用于从 iterable 的每个元素中提取用于比较的键 (例如 key=str.lower).默认值为 None (直接比较元素). key 形参的值应该是个函数(或其他可调用对象),它接受一个参数并返回一个用于排序的键.
假设有其他类型的变量,比如一个自定义的类或者列表中又是一个列表.以官网例子为例有这样一个列表,其元素为元组,
可以用以下方式按照年龄排序
类似的有自定义类
可以用如下方式进行排序
也可以显示定义一个函数,且只有一个参数,返回用于排序的键,比如
都说到这里了大家应该明白就是定义一个函数返回一个用于排序的键,可以用lambda函数或者 def 定义都可以.
上面实现的简单函数实际就是实现了返回一个有序结构的第 n 的元素,或者某个类中的某个属性,所以呢 Python 提供了便利功能,使访问器功能更容易,更快捷.operator 模块有 itemgetter() 、 attrgetter() 函数.分别完成返回第 n 个元素,某个属性功能.上面的排序可以用如下方式进行实现
这种作用先定义如何比较两个变量,以上面的学生列表按照年龄排序为例
这种做法自定义比较函数接收两个形参,返回比较结果(bool),而新式方法接受一个参数,返回的是比较的键.
进行一个简单的升序排列直接调用sorted()函数,函数将会返回一个排序后的列表:
sorted函数不会改变原有的list,而是返回一个新的排好序的list
如果你想使用就地排序,也就是改变原list的内容,那么可以使用list.sort()的方法,这个方法的返回值是None.
另一个区别是,list.sort()方法只是list也就是列表类型的方法,只可以在列表类型上调用.而sorted方法则是可以接受任何可迭代对象.
list.sort()和sorted()函数都有一个key参数,可以用来指定一个函数来确定排序的一个优先级.比如,这个例子就是根据大小写的优先级进行排序:
key参数的值应该是一个函数,这个函数接受一个参数然后返回以一个key,这个key就被用作进行排序.这个方法很高效,因为对于每一个输入的记录只需要调用一次key函数.
一个常用的场景就是当我们需要对一个复杂对象的某些属性进行排序时:
再如:
前面我们看到的利用key-function来自定义排序,同时Python也可以通过operator库来自定义排序,而且通常这种方法更好理解并且效率更高.
operator库提供了 itemgetter(), attrgetter(), and a methodcaller()三个函数
同时还支持多层排序
list.sort()和sorted()都有一个boolean类型的reverse参数,可以用来指定升序和降序排列,默认为false,也就是升序排序,如果需要降序排列,则需将reverse参数指定为true.
排序的稳定性指,有相同key值的多个记录进行排序之后,原始的前后关系保持不变
我们可以看到python中的排序是稳定的.
我们可以利用这个稳定的特性来进行一些复杂的排序步骤,比如,我们将学生的数据先按成绩降序然后年龄升序.当排序是稳定的时候,我们可以先将年龄升序,再将成绩降序会得到相同的结果.
传统的DSU(Decorate-Sort-Undecorate)的排序方法主要有三个步骤:
因为元组是按字典序比较的,比较完grade之后,会继续比较i.
添加index的i值不是必须的,但是添加i值有以下好处:
cmp参数的使用方法就是指定一个函数,自定义排序的规则,和java等其他语言很类似
也可以反序排列
① (按字母顺序排列)——sort()函数
例:
cars?=['bmw','audi','toyota','subaru']
cars.sort()
print(cars)
输出得到
['audi', 'bmw', 'subaru', 'toyota']
cars.sort(reverse=True)# reverse"adj. 反面的;颠倒的;n. 倒转,反向"
['toyota', 'subaru', 'bmw', 'audi']
print("Here?is?the?original?list:")
print("\nHere?is?the?sorted?list:")
print(sorted(cars))
print("Here?is?the?original?list?again:")
Here is the original list:
['bmw', 'audi', 'toyota', 'subaru']
Here is the sorted list:
Here is the original list again:
cars.reverse()
['subaru', 'toyota', 'audi', 'bmw']
第一段:sort_values()函数用途
pandas中的sort_values()函数原理类似于SQL中的order by,可以将数据集依照某个字段中的数据进行排序,该函数即可根据指定列数据也可根据指定行的数据排序.
第二段:sort_values()函数的具体参数
用法:
①.DataFrame.sort_values(by='##',axis=0,ascending=True, inplace=False, na_position='last')
参数说明
by指定列名(axis=0或'index')或索引值(axis=1或'columns')
axis若axis=0或'index',则按照指定列中数据大小排序;若axis=1或'columns',则按照指定索引中数据大小排序,默认axis=0
ascending是否按指定列的数组升序排列,默认为True,即升序排列
inplace是否用排序后的数据集替换原来的数据,默认为False,即不替换
na_position{'first','last'},设定缺失值的显示位置
第三段:sort_values用法举例
创建数据框
#利用字典dict创建数据框
import numpy as np
import pandas as pd