yxwzyyk 最近的时间轴更新
yxwzyyk

yxwzyyk

V2EX 第 118179 号会员,加入于 2015-05-22 09:04:38 +08:00
yxwzyyk 最近回复了
2018-12-15 16:29:46 +08:00
回复了 yxwzyyk 创建的主题 站长 话说现在网盘搜索站还有的玩吗?
@soho176 😂爬虫是最乱的一块代码了不好意思给人看,全文查找这东西 elasticsearch 了解一下,中文分词加上拼音分词自定义词典以及繁体简体转换,基本就能做到了
2018-12-14 16:42:43 +08:00
回复了 yxwzyyk 创建的主题 站长 话说现在网盘搜索站还有的玩吗?
@soho176 哈哈你想学习啥,服务器? 爬虫? 全文查找?
2018-12-13 15:56:31 +08:00
回复了 yxwzyyk 创建的主题 站长 话说现在网盘搜索站还有的玩吗?
@sarlanori 别的网盘也会有😂因为才开始所以还没来得及去爬取别的网盘的资源
2018-12-13 15:44:31 +08:00
回复了 yxwzyyk 创建的主题 站长 话说现在网盘搜索站还有的玩吗?
@sarlanori 这个怎么说呢,这个算定制搜索吧
2018-12-13 15:43:53 +08:00
回复了 yxwzyyk 创建的主题 站长 话说现在网盘搜索站还有的玩吗?
@syl9617016 😂要感谢虫部落
2018-12-13 15:43:33 +08:00
回复了 yxwzyyk 创建的主题 站长 话说现在网盘搜索站还有的玩吗?
@allen2012 哈哈喜欢就好
2018-12-13 10:48:33 +08:00
回复了 yxwzyyk 创建的主题 站长 话说现在网盘搜索站还有的玩吗?
@mon3 URL 就是 uuid 了, 相关资源用的是 elasticsearch, tag 是我用来作为一种可拓展的分类手段
2018-12-12 16:52:00 +08:00
回复了 yxwzyyk 创建的主题 站长 话说现在网盘搜索站还有的玩吗?
@Cosinex 有些新的很快就会失效,服务器有检查到就会删除
2018-12-12 16:47:08 +08:00
回复了 yxwzyyk 创建的主题 站长 话说现在网盘搜索站还有的玩吗?
@MonsterTan 并没有开源,这东西不是都那一套吗?python 写好规则爬取和提交,接着部署到各个地方,服务器负责数据过滤和整理,然后 es 进行搜索,几个定时任务负责定期扫描去掉失效链接
2018-12-12 14:42:07 +08:00
回复了 yxwzyyk 创建的主题 站长 话说现在网盘搜索站还有的玩吗?
@zoola 应该泛指了很多敏感词吧,不该出现的东西
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2947 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 14:18 · PVG 22:18 · LAX 06:18 · JFK 09:18
Developed with CodeLauncher
♥ Do have faith in what you're doing.