良心总结帖:十分钟了解Pandas核心内容

作者: 懒人老刘LazyLiu分类: 计算机技术 发布时间: 2022-05-22 19:00:00 浏览:51232 次

良心总结帖:十分钟了解Pandas核心内容

懒人老刘LazyLiu:
本视频中的数据和代码的GitHub地址: https://github.com/thefriedbee/video-source-code/tree/master/v22_pandas

【回复】怎么处理千万级数据 时间控制在秒
钨钨钨钨钨钨:
从没用pandas,因为要用,晚上学了一遍,当晚就能爬完了自己的小项目。视频做的真是好。赞👍。

艾氢一:
我电脑内存16g,用pandas处理1000万行数据(3g左右),内存就吃满了. 我查资料说,是pandas进行处理的时候,会建立副本,导致内存升高的. 想问一下up和大家怎么用pandas操作大量数据...[大哭]

【回复】可以分批处理,比如拆成十个csv文件,一次只处理100万行数据,最后再合并
【回复】最好的办法是,不要用pandas,pandas不是大数据分析工具,大数据时代有更好的包。
zerodel:
pandas的设计明显比R里面的乱, 更赶不上tidyverse里面的思路. 比如说, df.info(), df.dtypes, df.shape. 这几个都是为了得到df的一个概述信息.结果一些是属性, 不用括号,一些是成员函数, 需要括号. 就很乱. 从人思考的角度来说, 不管如何,我都是要去"查询"数据. 而不是让数据说给我. 这方面,R的统一多了. OOP的思路放在数据分析这块, 不是很好用.

【回复】回复 @极客鸭geekDuckKonig : tidyverse里面的行话啊, 如果能够先熟悉一下SQL 语句 以及 ggplot的那套绘图思路. 就很好理解了. 直接上来是有些门槛. 毕竟R一开始是搞统计的人捣鼓出来的语言.
【回复】最近也用了用R/tidyverse画图,给我的感觉就是里面默认的行话/黑话太多,很多东西只有搞数据科学的人懂。可能如果要是出一期视频的话很难讲清,反而pandas入门更快。
辣椒油辣酱油:
就喜欢这样言简意赅不注水的 支持[打call]

233sama:
非常好的分享,没有浮于表面只为展示自己技术力,而是由浅入深的干货,值得一键三连加关注。希望多出点。

El_Buen_Cesare:
使用非VS的IDE的xdm注意了,通常IDE下载下来一般是没有{}pandas库的,用命令行的pip install pandas安装pandas和其他几个库就可以用了(VS可以直接软件内下载)

墨客本人:
是jupyter上演示的嘛,第一次看的时候还没用过jupyter,没看进去。第二次看。 知识密度很高,受益匪浅。[抱拳]

wagllm:
看了一分钟视频,百度了一晚上了[doge]

xllyyyyy:
数据分析这仨条全看完了。真的大赞。能再出个pytorch的不[doge]

【回复】pytorch可以看看别的人的资源,感觉还是比较好入门的
第九骑士2020:
相当好的宝藏视频! pandas对于初学者来说东西太多,不知道哪些有用没有,容易怀疑人生。 现在把最常用的调出来,就可以入门了。剩下的自己就可以看懂。

一米八少女心:
三连了,基本能看懂也是之前学过,就时间处理我有点不太行

神原謙嗣:
对于我这个学过一遍,但一两个月不用记忆模糊的人来讲,这个视频太好用了

编程 Data Analysis 搬砖 大数据 数据 数据处理 数据科学 Python Pandas 技能提升营

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!

更多相关阅读