pandas操作:生成器__iter__分析数据样本
在Jupyter Notebook中通常很难像使用Excel一样难逐行或逐个组地浏览数据集。一个非常有用的技巧是使用 generator 生成器和Ctrl + Enter组合,而不是我们常规的Shift + Enter运行整个单元格。这样做就可以很方便地迭代查看同一单元格中的不同样本了。
一、首先在单元格中使用.groupby()(或.iterrows())和.__iter __()创建一个生成器:
generator = df.groupby(['identifier']).__iter__()
二、然后,根据自己需要运行的次数,使用键盘快捷键 Ctrl + Enter 逐个查看数据。
group_id, grouped_data = generator.__next__()
print(group_id)
grouped_data
下面是taitanic数据集的示例。正常分析的时候,所有乘客都混在一起,我们是不能单独地隔离每组乘客的,使用这种方法就可以非常简单地分析一组乘客。
相关推荐HOT
更多>>jquery获取属性值
要获取 jQuery 元素的属性值,您可以使用 attr() 函数。该函数接受一个属性名作为参数,并返回该属性的值。详情>>
2023-04-21 10:25:53字符串和字符数组有何区别
字符串(String)和字符数组(Character Array)是两种在编程中用于处理文本数据的数据类型,它们在一些方面有区别。数据类型:字符串是一个引用类...详情>>
2023-04-14 14:47:15测试工程师需要的技能
测试设计和执行:测试工程师需要具备良好的测试设计和执行能力,包括编写测试用例、测试场景、测试数据,执行测试,记录测试结果和缺陷信息等。详情>>
2023-04-12 15:36:04持续集成是什么意思
持续集成(Continuous Integration,简称CI)是一种软件开发和测试实践,旨在通过频繁地将代码集成到共享代码仓库,并自动构建、测试和发布软件,...详情>>
2023-04-11 11:53:11