V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  owenliang  ›  全部回复第 7 页 / 共 32 页
回复总数  629
1 ... 3  4  5  6  7  8  9  10  11  12 ... 32  
2018-10-29 19:32:46 +08:00
回复了 iblislsy 创建的主题 程序员 求一个可行方案:计算新用户和老用户通讯录的最高匹配度
@iblislsy es 很成熟的,你这个需求取决于召回阶段拥有相同号码的记录数量,肯定不会很大,所以参与聚合计算量也不大,选型 es 问题不大。
2018-10-29 18:12:56 +08:00
回复了 iblislsy 创建的主题 程序员 求一个可行方案:计算新用户和老用户通讯录的最高匹配度
什么叫钢筋
2018-10-29 17:41:08 +08:00
回复了 caopi 创建的主题 JavaScript vue 异步组件的这个 require 是什么用法呢?
异步加载规范的样子,就是动态添加<script>标签到 HTML 中,用到某个 js 代码的时候异步加载。
2018-10-29 14:54:42 +08:00
回复了 zhangqilin 创建的主题 程序员 后端接口是否用 try/except 好?还是不用好?
我觉得框架捕获就可以,业务代码别处理那么多异常。

框架捕获了该打日志打日志,该采集采集,能追查能报警就很好。
2018-10-29 14:09:08 +08:00
回复了 iblislsy 创建的主题 程序员 求一个可行方案:计算新用户和老用户通讯录的最高匹配度
@guyskk0x0 redis 扩展性不好嘛,用 ES 就能应付,1000 万级别实时聚合没啥问题。
2018-10-29 13:59:57 +08:00
回复了 Ewig 创建的主题 Python scrapy 框架是单线程执行的 twisted?
@Ewig 是的,是单线程,请求并发度可以配置,基于 IO 多路复用并发(不是并行)。
2018-10-29 13:42:50 +08:00
回复了 ksmm 创建的主题 程序员 医学生想转行计算机,求各位打醒
楼主除了钱的因素以外,是否对从医本身没有什么兴趣? 我感觉刚毕业收入低点是正常的,又不是所有行业都是互联网搬砖,总要有一个沉淀的过程。
2018-10-29 13:37:59 +08:00
回复了 iblislsy 创建的主题 程序员 求一个可行方案:计算新用户和老用户通讯录的最高匹配度
我有一个方案,楼主看一下是否可行。(用 Elasticsearch,没什么神奇的东西)

核心思路:new user 有 100 个号码,找一个 old user 与 new user 的 phone 交集最大。

过程:
1,把 user phone 的关系一条一条的存到 ES 里。
2,给定一个 new user,它的 phone list 有 100 条,那么去 ES 里做 terms query 召回关联任意 phone 的记录。
3,召回的 user phone 记录的 phone 一定在 100 条内,所以接着做 agg 聚合统计每个 user 的出现次数,保留 size=10 就是相同号码最多的 10 个用户了。
2018-10-29 11:40:11 +08:00
回复了 Ewig 创建的主题 Python scrapy 框架是单线程执行的 twisted?
核心就是 spider,item,queue,pipeline。

其中 spider 产生 request 到 queue,不断取出 queue 里的 request 交给 twisted 异步网络 io,网络回调后继续回到 spider 重复这个过程。
2018-10-29 11:35:48 +08:00
回复了 calvincc 创建的主题 程序员 程序员哪些开发方向难度大?
写基础设施都很难。。。
2018-10-29 09:26:04 +08:00
回复了 V2XEX 创建的主题 程序员 是否应该优先学习简单、便捷的开发语言、工具?
生态牛逼,语言再恶心也得往下咽,是这个道理吧。
2018-10-26 11:55:42 +08:00
回复了 zcsnbb 创建的主题 Python 关于 scrapy 运行机制
读 scrapy.cfg 的 settings 可以找到 settings.py ,动态__import__给 load 起来,读里面的 SPIDER_MODULES 找到爬虫 spiders 包。

在这个包里每个.py 文件都是一个 module,可以动态__import__给 load 起来,找到 module 里继承了 scrapy.spiders.Spider 的 class,看一下这个 class 的__dict__['name']叫什么,是不是你启动传的那个。

没啥东西,就是动态__import__ module 啊,目录遍历啊,__dict__动态访问对象属性啊。
2018-10-25 10:11:25 +08:00
回复了 zllc 创建的主题 程序员 有多少同学是在 windows 下开发
@lcdxiangzi 牛,虚拟机文件跟着走的大神。
2018-10-25 09:37:24 +08:00
回复了 zllc 创建的主题 程序员 有多少同学是在 windows 下开发
在百度基本是 windows 开发,samba 同步到开发机,开发机是 linux。
2018-10-24 18:28:19 +08:00
回复了 mytry 创建的主题 程序员 MySQL 存储大量重复数据有什么好的优化方案?
大数据可以考虑上 hadoop,如果公司允许的话,就不太用操心存储量和计算性能的问题了。
2018-10-24 18:26:57 +08:00
回复了 iugo 创建的主题 程序员 在编程做具体项目的时候, 雕塑 vs. 积木?
过早优化是万恶之源。

一开始搭架子考虑太多,的确适得其反。
ssh 是基本权利啊,不存在连不上。
2018-10-24 11:33:29 +08:00
回复了 EXChen 创建的主题 Java 关于微服务中的链路追踪技术选型的疑问
不侵入的原理是什么,比如一个网络调用。
2018-10-23 20:16:30 +08:00
回复了 mokeychan 创建的主题 Go 编程语言 <取经>如何学习 GO 语言
@wfc951
2018-10-23 13:58:44 +08:00
回复了 mokeychan 创建的主题 Go 编程语言 <取经>如何学习 GO 语言
我录了个课,看完就干活了: https://coding.m.imooc.com/classindex.html?cid=281
1 ... 3  4  5  6  7  8  9  10  11  12 ... 32  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5299 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 35ms · UTC 09:13 · PVG 17:13 · LAX 02:13 · JFK 05:13
Developed with CodeLauncher
♥ Do have faith in what you're doing.