pandas 的初体验
pandas的初体验在进行大数据的分析和挖掘时,使用计算机编程语言是一大趋势。对于的初学者来说,python 程序语言是一个不错的选择。这是因为python有很多强大第三方库,能让初学者快速上手。 以
pandas 的初体验 python 在进行大数据的分析和挖掘时,使用计算机编程语言是一大趋势。对于的初学者来说, python 程序语言是一个不错的选择。这是因为有很多强大第三方库,能让初学者快速上手。 以 pandas 为例,简单介绍编程语言处理数据的方法。 目标:分析某校姓氏情况 数据整理: DataFrame #数据采集:从教务处获得全校的学生名册,读取数据,创建对象 df =pd.read_excel('name.xlsx') 学 4 M 号 M 马宋 W 0 1 1 华 — 马洁 1 1 2 K- 2S 王可 2 1 3 A 癸 王科 3 1 4 «- ■ 商 王越 4 1 5 一 ・ •• ・ ••• — — • ・ M 213 1 3 1 6 4 = 213 1 3 2 6 5 商 213 1 3 3 三 6 6 商 渤司 213 1 3 4 三 6 7 涛 K ar 213 1 3 5 6 8 2136 = m 4 rows x columns njs =df.pop(" #数据整理:删除无关数据,如年级、班级、学号列;添加所需列:姓氏 年级") bjs =df.popC 班级”) xhs =df.popf" 学号”) dfdf[""].str[OJ [”姓氏"]=姓名 姓 姓 名 氏 马耕 马 0 马洁 马 1 然 王唳 王 2 王科 王 3 博 王 4 - • - … 213 麻命 麻 1 213 董元^ 董 2 213 童 3 谢周 213 谢 涛 4 213 童嘲 童 5 2136 rows x2 columns xingGroup =df.groupby #数据计算:按姓氏分组统计人数,并按降序排序 ("姓 as_index=False).count() xingGroup.rename(columns={" 氏”,姓名":"人数"}) xingGroup.sort_values(" A&",ascending=False,inplace=True)

