pandas是个功能很强大的函数,对经常使用excel进行数据处理的朋友很有帮助
今天教大家如何用pandas实现excel中最常见的10个函数,大大提高你的工作效率
首先我们用pandas读取数据:
import pandas as pd
data=pd.read_csv('成绩表.csv',encoding='gbk')
data
pandas计算每名同学的总分:
data['总分']=data.sum(axis=1) #axis=1代表对行进行求和
data
求语文总分:
data.sum(axis=0,numeric_only=True) #axis=0代表对列进行求和,numeric_only=True表示只对数字求和
语文 689.0
数学 727.0
英语 712.0
总分 2128.0
dtype: float64
pandas计算总分最低分:
data['总分'].min()
197.0
pandas计算总分最高分:
data['总分'].max()
275.0
pandas计算英语成绩平均分:
data['英语'].mean()
79.11111111111111
pandas统计共有多少同学:
data['姓名'].count()
9
将总分大于270分的判为优秀,小于270分判为良好:
data['等级']=data.总分.apply(lambda x:'优秀' if x >= 270 else '良好')
data
在excel中实现如下图:
我们用pandas也可轻松实现:
data['考生num']=data['考生号'].str.extract('(\d{4})')
data
excel用实现如下图:
pandas稍微复杂一些:
import datetime as dt
now_year =dt.datetime.today().year #当前的年份
data['出生年月']=pd.to_datetime(data['出生年月'])
data['年龄']=now_year-data.出生年月.dt.year
data
excel实现如下图:
pandas实现代码如下:
data.apply(lambda x : sum(data['性别']=='女'),axis =0)
考生号 3
姓名 3
性别 3
出生年月 3
语文 3
数学 3
英语 3
总分 3
等级 3
考生num 3
年龄 3
dtype: int64
花名册表格如下:
data1 = pd.read_csv('花名册.csv',encoding='gbk')
data1
考生号 | 姓名 | 性别 | 出生年月 | |
---|---|---|---|---|
0 | sccu1001 | 马伟良 | 男 | 2001/12/1 |
2 | sccu1003 | 牛京田 | 男 | 2001/5/2 |
3 | sccu1004 | 王建国 | 男 | 2002/4/14 |
4 | sccu1005 | 宁丁胜 | 男 | 1999/2/24 |
5 | sccu1006 | 刘华 | 男 | 2000/1/28 |
6 | sccu1007 | 孙苛示 | 女 | 2001/7/16 |
7 | sccu1008 | 安也卫 | 女 | 2000/8/30 |
8 | sccu1009 | 成功 | 男 | 2000/4/9 |
成绩单表格如下:
data2 = pd.read_csv('成绩单.csv',encoding='gbk')
data2
考生号 | 语文 | 数学 | 英语 | |
---|---|---|---|---|
0 | sccu1001 | 67.0 | 78.0 | 86 |
1 | sccu1002 | 56.0 | 73.0 | 68 |
2 | sccu1003 | 70.5 | 78.0 | 53 |
3 | sccu1004 | 67.0 | 79.5 | 74 |
4 | sccu1005 | 88.0 | 95.0 | 89 |
5 | sccu1006 | 68.5 | 70.0 | 73 |
6 | sccu1007 | 89.0 | 97.0 | 89 |
7 | sccu1008 | 90.0 | 67.5 | 92 |
8 | sccu1009 | 93.0 | 89.0 | 88 |
合并后的表格:
data3 = pd.merge(data1,data2[['考生号','语文','数学','英语']],how = 'left',on = '考生号')
data3
公众号后台回复「excel10」可自动获取本文代码和数据。
最后,为了方便大家学习,鸟哥给大家准备一份pandas玩转Excel的自动化办公视频教程。这套视频即生动有趣,又通俗易懂,而且是高清视频,非常适合pandas学习者,总共30个课时,而且附带源码和数据素材,已经给大家打包准备好,获取方式如下:
获取视频:
1.扫码下面的公众号
2.输入:自动化办公
长按输入:pandas
总结了pandas提取数据的15种方法,统统只需1行代码,真香!
用同事电脑登了一次百度账号,搜索框就被他用python监控了,我哭了
微信扫一扫
关注该公众号
发送给作者