这些你必须知道的Pandas技巧
Tina 2019-11-21 来源 : 阅读 973 评论 0

摘要:无需更多介绍,Pandas已经是Python中数据分析的常用工具了。

无需更多介绍,Pandas已经是Python中数据分析的常用工具了。对于pandas新手而言,Pandas为Python编程语言营造了一个高水平的操作环境,还提供了便于操作的数据结构和分析工具。下面小职为大家分享一下一些Pandas的小技巧。


这些你必须知道的Pandas技巧


Pandas这个名字是由“面板数据”(panel data)衍生而来,这是一个计量经济学中的术语,它是一个数据集,由同一个个体在多个时间段内所观察的结果组成。


数据范围

从外部应用程序接口(API)或者数据库中抓取数据的时候,通常需要确定一个数据范围。

Pandas可以很好地解决这一问题,它的data_range函数能够产出按日、月、年等方式递增的日期。

假设现在需要一组按天数递增的数据范围。把产出的date_range转化为开始和结束日期,这一步可以用后续函数(subsequentfunction)完成。


使用指示符合并

合并两个数据集就是将它们变成一个数据集的过程,这需要根据它们的公共属性或栏来对齐其中的每一行。

合并函数中有许多arguments(对应于传递给函数的参数的类数组对象),其中指示符(indicator)argument可主要应用到合并过程中,它在左、右或者两边的数据帧(DataFrame)函数添加_merge栏。

这一栏就显示了“数据行是哪里来的”。用_merge栏来处理更大的数据集会非常有用,尤其是需要检查合并操作的正确率时。

merge栏可以用来检查是否得到了我们预期的行数,而且它反映的是来自两个数据框架的预期值。


Pivot Table

Pandas可以用来创建MS Excel样式数据透视表(Pivot Table)。

在本文的例子中,数据的关键列是含有缺失值的“LoanAmount”。为了获得具体的贷款额度数字,我们可以用Gender、Married、Self_Employed这几列的贷款情况进行估算:


DataFrame排序

Pandas可以轻松基于多列进行排序Pandas的sort函数已经不能用了,现在排序要调用sort_value。


合并DataFrame

当我们需要将来自不同来源的信息进行整合时,

合并DataFrame(或者你们爱说数据框)就变得很重要了。

本文由 @职坐标 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 0
看完这篇文章有何感觉?已经有0人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论
本文作者 联系TA

拧成一股绳,搏尽一份力,狠下一条心,共圆一个梦。

  • 1
    推荐岗位
  • 2472
    人气
  • 100%
    受欢迎度

已有3人表明态度,100%喜欢该职业规划老师!

进入TA的空间
资讯动态 直通车
  • 索取资料 索取资料 索取资料
  • 答疑解惑 答疑解惑 答疑解惑
  • 技术交流 技术交流 技术交流
  • 职业测评 职业测评 职业测评
  • 面试技巧 面试技巧 面试技巧
  • 高薪秘笈 高薪秘笈 高薪秘笈
TA的其他文章 更多>>
测试 | 你究竟适不适合成为一名程序员?
面试技巧 100% 的用户喜欢
IT行业面试技巧,90%的人都不知道
面试技巧 100% 的用户喜欢
JAVA不知道如何面试?两年经验者告诉你!
面试技巧 50% 的用户喜欢
说说那些程序员必须掌握的核心算法!
就业趋势 0% 的用户喜欢
未来AI将在这些领域发光发热!
就业趋势 0% 的用户喜欢

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved

208小时内训课程