以下文章来源于数据分析与统计学之美 ,作者黄伟呢
免费领"Python自动化办公原创文档",共52页,回复“自动化”三个字领取!
Pandas 是数据科学家做数据处理时,使用最多的工具。
对比Excel,我们可以发现:Pandas基本可以实现所有的Excel的功能,并且比Excel更方便、简洁,其实很多操作我们在过去的文章中,或多或少都讲述过。
但是在数据框上,完成各种 “条件格式” 的设置,帮助我们更加凸显数据,使得数据的展示更加美观,今天还是头一次讲述。
上图左表展示的是某班级期末考试的成绩数据,我们要利用左表完成如右表的效果展示,需要完成的目标如下:
用过Pyecharts的朋友可能都知道“链式规则”,在这里我们同样可以采用这种方法,用一行代码就可以实现上述所有的功能。
import pandas as pd
df = pd.read_excel("特殊.xlsx")
df.index = list(range(df.shape[0]))
df
结果如下:
df.style.format('{:.1f}',subset='均值').set_caption('高三(5)班期末考试成绩').\
hide_index().hide_columns(['索引']).bar('语文',vmin=0).highlight_max('均值').\
background_gradient('Greens',subset='数学').highlight_null()
结果如下:
这个是Pandas0.17.1中的新功能。官方文档中说到:这是一项新功能,正在积极开发中。我们将添加功能,并可能在将来的版本中进行重大更改。
这个方法出现在pandas.formats.style.Styler类中,今天在这里就不详细介绍该方法的原理,大家知道怎么使用就行,后将在后面的文章中为大家慢慢介绍。
上面我们直接一行代码实现所有的功能,如果我们只想实现某一个功能怎么办呢?
好了,今天就为大家介绍到这里,赶紧下去尝试吧!
公号后台回复:条件格式,获取测试数据!
微信扫一扫
关注该公众号
前往“发现”-“看一看”浏览“朋友在看”