1
lixia625 OP 据说 pandas 的 merge 是专门优化过的算法,那是不是意味着就算我把数据导入数据库用 sql 来做内存也顶不住?
|
2
rrfeng 2018-04-28 15:23:58 +08:00 via Android
什么样的数据什么样的 join ?这种肯定要根据具体情况优化了。
100w 也没有 16G 吧?一条多大? |
3
lixia625 OP @rrfeng 十多列 普通的数字字符类型 数据本身不大,几百 M 吧,两个同样规模的表作 join
|
4
resuly 2018-04-28 15:41:05 +08:00
使用 chunk 试一下?
|
5
data2world 2018-04-28 17:20:44 +08:00
上代码,谢谢
|