今天本来抱着试一试的心态刷一下面试,莫名其妙被 PASS
面试官:你介绍一下你自己
我:巴拉巴拉
面试官说:你用 python 还是 java 开发爬虫
我说: python
面试官:什么场景或有验证码
我:这个看业务方喜好,他们要喜欢什么时候都可以用
面试官:你识别过验证码吗?
我:我识别过字符和数字不复杂的
面试官:什么原理
我:用取字摸
面试官:实际实现过吗?
我:实现过,用 tesseract-ocr
面试官:你识别过其它的吗
我:我之前识别过 163 的,但是准确率太低
面试官:你认为什么叫高
我: 60%算及格,我只到 30%
面试官:你怎么知道哪里有验证码呢
我:没有特别好的办法,只能在表单附近找有没图片
面试官:你怎么得到验证码,是用浏览器方式吗?(我实在没明白什么是浏览器方式)
我:我直接解析 xpath ,得到路径下载二进制文件下来,然后本地识别就行了
面试官:我知道了(态度特别差)
感谢大家热情的回复,但是我补充一句
1
shakoon 2016-05-13 14:49:50 +08:00 3
我觉得是,你说的东西面试官不懂,他没法继续问你下去
|
2
zfyp 2016-05-13 14:51:38 +08:00
可能是你爬过他们的数据被发现了
|
3
Pastsong 2016-05-13 14:51:38 +08:00 via Android
这家公司专门做爬虫的吗
|
4
pierre1994 2016-05-13 14:57:58 +08:00
是什么部门的什么岗位啊?看不出来问题
|
5
SlipStupig OP |
6
bk201 2016-05-13 15:00:44 +08:00
你这回答没法深入问你啊。比如”什么时候用?这个看业务方喜好,他们要喜欢什么时候都可以用“就像问你喜欢吃什么,回答随便。
|
7
SlipStupig OP @bk201 没个范围啊,你说社交类网站哪里需要验证码,我可以告诉你,只问验证码什么需要,这个太广了,所有的网络协议都可以使用验证码啊!我该怎么回答呢?
|
8
yuyang1110 2016-05-13 15:11:31 +08:00
话说, pass 不是说通过的意思么。。。=_=
|
9
Tyrion 2016-05-13 15:13:11 +08:00
@SlipStupig 这时候要是举几个例子会好很多吧,比如举几个自己比较熟悉的使用验证码的场景,也顺带可以让面试官问下去。面试总要聊下去吧(逃,我去年的面试也特别失败
|
10
Kirscheis 2016-05-13 15:16:13 +08:00 via Android
面试官不是这方面或者没见过这方面的技术吧。。如果真按你这描述来看,面试官太菜
|
11
SlipStupig OP @Kirscheis 而且问的最匪夷所思的是怎么得到验证码这个问题,他还问我是浏览器方式还是别的办法,我心里就在想啊,浏览器是靠气功把图片读出来的吗?我说直接下载二进制文件,他还反复问了我两遍。
@yuyang1110 玩过 QQ 斗地主么?= = |
12
hitmanx 2016-05-13 15:29:44 +08:00
面试官被你打击了
|
13
fyooo 2016-05-13 15:53:11 +08:00
可能面试官本来就对你有一些成见了,这个看缘分的,楼主加油,再面试一下其他投缘的公司或者这家公司的其他岗位咯:)
|
14
ayaseangle 2016-05-13 15:57:49 +08:00 via Android
人工打码平台
|
15
SlipStupig OP @fyooo 我很赞同,我感觉他怨气很重,应聘时个小公司,本来就是看 BOSS 产品的时候,有一个 HR 联系我,我觉得 HR 很 NICE 然后跟他们 CTO 聊聊,找工作我从来没担心过
|
16
lizhenda 2016-05-13 16:22:39 +08:00
小公司奇葩多,哈哈~
|
17
newghost 2016-05-13 16:38:04 +08:00
估计叫你过去了解一下技术上怎么实现
其实他也不懂 |
18
lebowsk1s 2016-05-13 16:43:47 +08:00
浏览器方式。。。。。。这位明显自己不懂,可能连 HTTP 请求响应是怎么回事都不懂,懂的就不会问出这样的问题
|
19
jarlyyn 2016-05-13 16:50:10 +08:00 via Android
的确可以通过浏览器方式抓取,这样能执行 js
|
20
SlipStupig OP @lebowsk1s 第一次听说,可能是我不会气功吧!
|
21
cxbig 2016-05-13 16:54:55 +08:00
LZ 想太多,面试失败别总想着是自己的问题
|
22
leassy 2016-05-13 16:55:15 +08:00 2
面试的觉得楼主对他是个威胁,所以决定不录用,我们公司就是这样的
|
23
SlipStupig OP @jarlyyn 请问浏览器抓取是通过气功还是 HTTP 协议?我发包和浏览器发包有什么区别?
|
24
SlipStupig OP |
25
assassinpig 2016-05-13 16:57:56 +08:00
明显没有问出他想问的东西 又不愿意多透露具体应用场景
|
26
SlipStupig OP @assassinpig 没有场景我更不好回答了,图像处理这块我确实不是强项,但是他问的东西我觉得好业余
|
27
iphantom 2016-05-13 17:04:25 +08:00
根据我的经验
他问的就是他目前遇到的问题 把问题当面试题 他只是想通过面试 来解决他的问题 而不是招聘 |
28
SlipStupig OP @iphantom 如果是这样应该问更细致的东西啊,处理验证码又不是网上没教程,你要看不会我随便说两句,你也解决不了啊
|
29
ice00shark 2016-05-13 17:18:17 +08:00
我觉得他是想问你是怎么确定这个登录需要验证码的。
他们可能是需要智能的分析出何时需要解验证码。 |
30
jarlyyn 2016-05-13 17:23:36 +08:00 via Android
|
31
SlipStupig OP @ice00shark 我说了怎么识别验证码出验证码, form 内看有没图片,其实还有其它办法,他不让我说,就反复问我怎么得到验证码,对我直接下载验证码这种方式我感觉他特别轻蔑
|
32
SlipStupig OP @jarlyyn 你直接用 webkit 或者 CEF 等获得验证码图片的数据,是用 JS 获得的,而不是不是靠协议?
|
34
qqjt 2016-05-13 17:28:45 +08:00 2
……一股找人解答疑难的气息
|
35
Felldeadbird 2016-05-13 17:28:47 +08:00
面试官不会带入面试者去他的问题,所以这个面试官不是个好得面试官。也就是说他的技术没楼主好。
|
36
SlipStupig OP @jarlyyn phantomjs 不需要网络请求就能得到远程 server 的数据?
|
37
jarlyyn 2016-05-13 17:30:33 +08:00 via Android 2
|
38
Ouyangan 2016-05-13 17:31:13 +08:00
面试官比较菜
|
39
cxshun 2016-05-13 17:39:01 +08:00
应该是面试官比较菜,不懂那些东西。
|
40
onion83 2016-05-13 17:47:00 +08:00
> 浏览器是靠气功把图片读出来的吗?
让一个手欠格式化硬盘丢一年数据的,沮丧一下午的人活过来了 :) |
41
chiu 2016-05-13 17:47:43 +08:00
没给面试官装逼的机会?
|
42
learnshare 2016-05-13 17:54:54 +08:00
你怎么知道哪里有验证码呢?
这个问题是怎么问出来的 |
43
sumuu 2016-05-13 17:59:29 +08:00
哈哈~~你可能需要某些奇葩公司了.
昨天我一前同事,给我发了一组他们现在公司的招聘聊天的截图. 大致就是"搞不定的技术没有关系,叫 HR 发个高薪招聘,问一下来面试的就有方案了". 现在技术窃取手段真的很多,以前只有再段子上面的,现在已经使用了. |
44
windfarer 2016-05-13 18:09:45 +08:00 via Android
因为那个公司正在处理验证码方面的问题, 233
|
45
hyzjshwo 2016-05-13 18:19:55 +08:00 1
@sumuu 我还真遇到了。
技术聊了 3 个小时 然后 hr 过来说:要不今天先到这里,你要的待遇怎么和现在 double ? 我说:我在创业,都是降薪的,我想拿回之前的待遇 她说:我不管这些,我就看你现在的。我觉得你要的待遇和你能力不符 我说:那问题就简单了,你们能给多少? 她说:这个我需要和技术讨论一下,但是你要的太高了 ps :某知名大互联网公司,技术两轮面感觉没问题,面试官都觉得不错。 其实从面的时候就知道他们并不想花这个钱,第二也没有我合适的职位。 hr 说我要的待遇和能力不符,至少我技术面没有倒下,再说你说这句话那么你有个 range 吧? 之后我问那你觉得多少合适,居然说要和技术讨论,这不前后矛盾吗? 我为了掌握技术和提升自己,比别人多付出多少时间和精力 你在这里说这些完全是浪费我的时间。 |
46
peter999 2016-05-13 18:57:43 +08:00
不都是走打码平台吗
|
47
fzinfz 2016-05-13 20:04:09 +08:00
浏览器方式应该是指 selenium+firefox/chrome 那样的方式吧
|
48
pysama 2016-05-13 20:16:33 +08:00
@SlipStupig 话说气功是什么黑科技,求科普
|
49
josephshing 2016-05-13 21:11:22 +08:00
也有可能是面试官心情不好 很正常
|
50
alexapollo 2016-05-13 21:17:17 +08:00
面试本来就被很多人当作了答疑的过程。。
|
51
lebowskis 2016-05-13 21:17:20 +08:00
@jarlyyn 验证码的地址就算是 JS 生成的也得走请求,说一千道一万,除了本地生成的不说,哪种方式的生成不用走请求?
|
52
hanxiV2EX 2016-05-14 00:28:20 +08:00 via iPhone
估计面试官是想说用浏览器找出验证码在 DOM 的哪个节点位置
|
53
ihuotui 2016-05-14 01:42:12 +08:00
验证码识别技术很多,而且开始流行不是验证码了,换拖动滑块。。
|
54
SlipStupig OP @ihuotui 还是验证码,只是验证方式变了
|
55
ersic 2016-05-14 07:35:51 +08:00 1
程序员:「老板,遇到问题解决不了了怎么办?可以招人吗?」
老板:「这样啊,我去叫 HR 发邀请面试。」 程序员:「太好了,谢谢老板!」 老板:「恩,面试就由你来了,记得只面试,不要人,面试题挑你遇到的问题问。」 |
57
Heavytiger 2016-05-14 09:14:07 +08:00 via iPhone
从来不从自身找问题,总是怀疑别人妒忌我,抱着这样的心态,我干上了自由职业。
|
58
whatisnew 2016-05-14 09:34:33 +08:00 1
程序员:「老板,遇到问题解决不了了怎么办?可以招人吗?」
老板:「这样啊,我去叫 HR 发邀请面试。」 程序员:「太好了,谢谢老板!」 老板:「恩,面试就由你来了,记得只面试,不要人,面试题挑你遇到的问题问。」 |
59
chimingphang 2016-05-14 10:50:40 +08:00
同意楼上的
|
60
SlipStupig OP @pysama 超新星爆炸产生的中子,通过阴阳五行加上胡椒粉调制的一种神奇力量,史称“神速力”!
|
61
yanyandenuonuo 2016-05-15 21:31:57 +08:00
@hyzjshwo 我也遇到这种问题了。。几个知名公司的 HR 最后都这样干了。。给不起工资何必开那么高呢,浪费双方的感情和时间。。。
|
62
cppgohan 2016-11-25 16:36:24 +08:00
楼主我来挖坟, 取字摸是什么意思?
能不能发个 url 科普一下, 另外, lz 有没有什么爬虫成果和心得, 分享分享:). 我只玩过很少量的网页数据分析, 自动下载. 验证码这块感觉很高级, 如果我的话, 估计直接考虑接入 api 了 |