V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  pzhdfy  ›  全部回复第 1 页 / 共 4 页
回复总数  61
1  2  3  4  
这不是大数据经典处理方法吗

将 PersonListA.csv 通过 name hash 拆分为 10 个,PersonListA_1.csv,PersonListA_2.csv...,PersonListA_10.csv (或者更多,每个文件能载入内存就行)
规则是每行数据通过 hash(name)%10 来确定放到哪个文件

将 PersonListB.csv 也是一样的原理,生成 PersonListB_1.csv,PersonListB_2.csv...,PersonListB_10.csv

这样 PersonListA_1.csv 只会根 PersonListB_1.csv 有相同 name 的数据,
所以只需要 10 组文件对比就行
108 天前
回复了 xiaochenzhu 创建的主题 汽车 拆车件的轮胎能不能买?
我买过 到手看到有火补痕迹 赶紧退货
20 款 a4 45 车主前来打 call 。
好像新款 45 已经有 gpf ,而且还降了些马力
198 天前
回复了 pzhdfy 创建的主题 iCloud 国区 icloud 2T+music 拼车(年/半年/季付)
满了
198 天前
回复了 pzhdfy 创建的主题 iCloud 国区 icloud 2T+music 拼车(年/半年/季付)
仅有最后一个了
198 天前
回复了 pzhdfy 创建的主题 iCloud 国区 icloud 2T+music 拼车(年/半年/季付)
还有 2 个车位
199 天前
回复了 Lexgni 创建的主题 iCloud iCloud 国区拼
@hyv2u 可以看下我发的车
看起来楼主有北京油车指标,还在租牌慕了
2022-09-30 11:06:02 +08:00
回复了 hhhhhh123 创建的主题 程序员 Python 读取 500M .pkl 文件,却用了 8 G 内存
@hhhhhh123
不是这样算的 openjdk 还是 c++写的呢
需要按照 pod 这类 c/c++原生内存布局才能省空间
cpython 的都是一堆对象,对象相互引用,每个对象额外的 overhead 特别大。
举个简单的例子 java 里面 int[] 和 Intager[] 的内存占用和计算速度差很大
2022-05-30 11:07:40 +08:00
回复了 2liuqi 创建的主题 上海 在上海的哥哥姐姐们,打算搞车的,你们都有意向搞什么车
北京的个人绿牌都已经排队到 45 年了
2022-05-24 17:33:35 +08:00
回复了 jseanj 创建的主题 北京 建了个北京露营交流群
求拉:cHpoZGZ5 ( base64 )
2022-04-19 14:37:20 +08:00
回复了 xudzhang 创建的主题 汽车 倍耐力 P ZERO (PZ4)和米其林 PS4S,哪个好一点?
原厂 pz4(AO)表示 p0 胎噪比较大,准备换 ps4 对比体验
2022-04-14 15:18:24 +08:00
回复了 konar 创建的主题 汽车 捷豹 XFL 还是雷克萨斯 ES260?
@jy02201949 林肯 z 是蒙迪欧换皮 横置前驱 ,福特美国都放弃轿车产品线了
2022-03-28 15:35:29 +08:00
回复了 Suigintou 创建的主题 问与答 灰尘多是应该买扫地机器人还是拖地机器人?
@yzding 装新风前也是听这么说 结果发现灰尘最大来源是皮屑和衣物纤维 次卧目前没住人 确实做到一个月都没啥灰尘 但主卧基本上一周拖一次 像是黑心棉结块 其实就是衣物纤维( from 松下吊顶新风用户)
2022-03-23 14:55:11 +08:00
回复了 2696284032 创建的主题 汽车 买啥子车坑少,预算 10-15 个 w,轿车
@tozp c63 ?
2022-03-10 15:02:49 +08:00
回复了 liuzh365 创建的主题 汽车 换几条好的轮胎,是否能有效避免雨天行驶打滑造成事故?
原厂倍耐力 p0 表示干地和湿地抓地力确实很好 确点就是胎噪大 而且不耐磨 3w 公里差不多就到磨损标记了
2020-12-08 17:24:16 +08:00
回复了 zhuangku556 创建的主题 汽车 最终 30 万还是选了奥迪 A4L…电动车下次再说吧
@lirno 45 车主 提车一月 表示真香
2020-03-07 14:07:37 +08:00
回复了 afirefish 创建的主题 Java 做个小调查,有多少公司已经迁移到 JDK11 了?或者使用 OpenJDK?
另外个人观点 如果现状稳定 没有需求不建议老项目升级 风险较大
我们遇到的问题是我们进程的堆有 200G,是个计算和内存密集型程序,容易发生 full gc, 原来可能暂停几十秒,使用 jdk11 后并行 full gc 一般控制在 3s 内
2020-03-07 14:03:56 +08:00
回复了 afirefish 创建的主题 Java 做个小调查,有多少公司已经迁移到 JDK11 了?或者使用 OpenJDK?
@BBCCBB
不是新方法 而是 clean 的方法变了 没有兼容的代码直接拿到 jdk11 上运行会有 bug

private static Cleaner lookupCleanerJava9(MethodHandles.Lookup lookup) throws ReflectiveOperationException
{
Class<?> cleaner = Class.forName("java.lang.ref.Cleaner");
Class<?> cleanable = Class.forName("java.lang.ref.Cleaner$Cleanable");

MethodHandle create = lookup.findStatic(cleaner, "create", MethodType.methodType(cleaner));

Object theCleaner;
try {
theCleaner = create.invoke();
}
catch (Throwable t) {
throw new RuntimeException("Unable to create cleaner", t);
}

MethodHandle register = lookup.findVirtual(
cleaner,
"register",
MethodType.methodType(cleanable, Object.class, Runnable.class)
).bindTo(theCleaner);

MethodHandle clean = lookup.findVirtual(cleanable, "clean", MethodType.methodType(void.class));

return new CleanerImpl(register, clean);
}

private static Cleaner lookupCleanerJava8(MethodHandles.Lookup lookup) throws ReflectiveOperationException
{
Class<?> cleaner = Class.forName("sun.misc.Cleaner");
MethodHandle register = lookup.findStatic(
cleaner,
"create",
MethodType.methodType(cleaner, Object.class, Runnable.class)
);

MethodHandle clean = lookup.findVirtual(cleaner, "clean", MethodType.methodType(void.class));
return new CleanerImpl(register, clean);
}
2020-03-07 14:02:36 +08:00
回复了 afirefish 创建的主题 Java 做个小调查,有多少公司已经迁移到 JDK11 了?或者使用 OpenJDK?
1  2  3  4  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3026 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms · UTC 13:48 · PVG 21:48 · LAX 06:48 · JFK 09:48
Developed with CodeLauncher
♥ Do have faith in what you're doing.