V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  wmttom  ›  全部回复第 1 页 / 共 5 页
回复总数  95
1  2  3  4  5  
@hh4062703 联系起来
@tolza 部门直招,有兴趣加下 vx 聊下
2020-10-30 16:22:18 +08:00
回复了 wandehul 创建的主题 装修 一人一句装修的经验或者坑
水压问题很容易被忽略。

汉斯格雅 花洒一定要规划好水压,规划好大功率的热水器,规划好大流量地漏(有可能发现水表流量、燃气表流量都不够支撑)。
无水箱智能马桶一定要看好水压是否合适,尤其是松下一体的旗舰款。
通过全网净水、软水后后的水压损失也需要评估进去。
2017-06-06 21:49:42 +08:00
回复了 Yunhao 创建的主题 Apple iOS11 开放了 NFC 接口
友情提示:北京一卡通可以在官方 app 里绑定卡号,微信或者支付宝买充值券,之后在地铁回收瓶子的机器上自助确认,从而干掉了生活中最后一个用现金的场景。
2017-05-29 15:36:23 +08:00
回复了 icodesign 创建的主题 MacBook MBP 15 外接 Dell P2415Q 偶尔会黑屏闪一下,不知为何
换一根好一点的 dp 线试试,遇到过 dp 线导致的类似问题。
2017-03-09 09:43:29 +08:00
回复了 1a1a11a 创建的主题 编程 爬虫判重
@1a1a11a 很多时候几个 9 的准确性已经足够了。
或者可以利用 Bloomfilter 的特性,不存在的一定不在,存在的再去查询存储索引,看是不是真的存在。
2017-03-09 00:24:14 +08:00
回复了 1a1a11a 创建的主题 编程 爬虫判重
bloom filter
2017-02-27 14:09:27 +08:00
回复了 sgissb1 创建的主题 健康 刷牙不规范,电动牙刷是否可救?
@sgissb1 据我的经历,和观察到身边人的情况。牙龈萎缩实际的原因大部分是牙周病,而不是你认为的『刷牙方式不正确』。
而且即使刷牙方式正确,对于口腔卫生也是不够的。
牙龈线消退不可逆,越早治疗越好。
牙周病差不多是国人牙齿脱落的主要原因了,建议系统学习下口腔卫生的知识,然后去专业口腔医院检查。
手动牙刷如果能保证刷牙时长、保证刷牙质量,感觉效果不比电动牙刷差的。但实际挺难天天保持的,电动牙刷能在不足质,不足时的情况下保证刷牙效果。
2017-02-27 11:21:36 +08:00
回复了 sgissb1 创建的主题 健康 刷牙不规范,电动牙刷是否可救?
先去看牙周科,治疗下牙龈。我当时症状没有这么严重都做了很多次龈下刮治。
然后养成全套牙齿健康习惯,正确的刷牙方式和时长,正确使用牙线和冲牙器,搭配日常的非处方漱口水,定期洗牙。
单纯刷牙是无法完成牙缝间的清洁的。
最后电动牙刷、冲牙器、一律买最好的,耗材到期就换,坚持正确使用就是在给自己省钱。
一旦去看牙医就会发现,去一次经常一个 iPad 就没了,电动牙刷的钱比起来不算啥。
2017-02-23 13:18:14 +08:00
回复了 littleqx 创建的主题 问与答 关于 U2B 视频自动搬运到优酷,秒拍等国内平台可行性讨论
@littleqx 曾经做过类似的事情,给一些建议。
YouTube 信息抓取可以走 Google 的 API ,个人感觉 API 设计的比国内的视频网站合理很多。抓取的的方式是通过 playlist 来抓取下面 videoId ,然后存下或者扔队列,供之后下载。
这里有个小技巧可以拿到一个 channel 下全部上传的视频 playlistId ,首先找到 channel 的 id ,有的用户会自定义 channel 页面 url ,这样的可以去用户视频跳转链接里面找,形如『 UCxxx...』的一个字符串,然后把这个 channel Id 的前两个字母从 UC 改为 UU ,然后把修改后的 id 当做 playlistId ,调用接口,就能拿到这个 channel 下所有视频了。
所以爬虫循环抓取的种子列表就是自己整理的一个 UU 开头的 playlistId 列表。 YouTube API 支持 etag ,支持下可以少好多网络请求。
下载可以写 Python 脚本调用 youtube-dl 来做,需要限制下 mp4 格式,这样抓下来的视频大概是 720p 清晰度,更高码率其他格式声音画面有些是分离的,还得合并不划算。最好也限制下大小,有些几个小时超长的视频其实搬过来没啥用,根据抓的码率和要的时长来算下限制的大小。
下载上传基本流程就是读取下载队列的 videoId 把视频下载到指定目录,之后把 videoId 扔到上传队列。上传脚本通过读取队列,从本地目录查找到文件调用接口上传,上传后删除本地视频文件。下载上传脚本都可以根据情况开多个。
代理方面更倾向于国外的服务器只做代理,不跑逻辑,无论境内外服务器中间用的啥协议传输,最后都在境内服务器上封装成 HTTP 代理,给抓取和下载使用。
有一段时间没接触过这些了,可能有的信息比较旧,仅供参考。
2017-02-17 14:15:39 +08:00
回复了 awolfly9 创建的主题 Python 有豆瓣的同事吗?想请教下豆瓣的反爬策略
以前做过的豆瓣抓取是,伪装真实浏览器 cookie ,每个 cookie 每分钟请求几十次,高频率容易被封 ip ,保持出验证码的低频多代理。然后出验证码都是英语单词,简单处理下背景,找个 OCR 接口一调,再做下单词纠错,自动提交验证码继续抓。
2017-02-16 10:49:50 +08:00
回复了 laidoulaile 创建的主题 问与答 这种视频转的动图 是用什么做的?
FFmpeg 直接指定视频,时间间隔,输出 gif 就行了
2017-02-16 10:46:50 +08:00
回复了 jimyan 创建的主题 程序员 你们团队都是怎么管理 API 文档的
Swagger +3
代码生成文档,或者文档生成代码,一旦各自独立书写总会产生不一致。
2017-02-12 15:05:53 +08:00
回复了 ringzero 创建的主题 Python 咨询: Python 有类似 PHP 的 filter_var 函数或者第三库吗?
有一个库叫 marshmallow ,在前段时间做 swagger 文档自动生成代码的时候使用过,用作验证类型还是很好使的,自定义空间也很大。
如果公司在用钉钉的话,用钉钉发消息报警也比较好用。
2016-12-30 00:05:09 +08:00
回复了 zdggLB 创建的主题 深圳 你在地铁里掉过啥? 东西落轨道
有朋友上地铁时候鞋被踩掉了,正好掉到了轨道里。因为是始发站,下一班地铁晚发车,工作人员下去把鞋捞上来了。不是始发站估计就得等到晚上地铁下班了。
2016-12-12 12:58:20 +08:00
回复了 Droog 创建的主题 PlayStation 4 PS4 购买问题
如龙 0 如龙极 如龙 6
2016-11-30 22:57:20 +08:00
回复了 lzt163 创建的主题 职场话题 请问 Python 做到什么程度可以参加面试 并有机会参加工作
可以抓取常见视频网站视频,并解析视频真实地址,试图做到全格式(一般常见格式 flv mp4 m3u8 列表,编码 h264 h265 ),全清晰度。有的 web 不好抓需要抓 app 练习下抓包,有的抓 http 不行需要抓 tcp 继续练习抓包, app 接口有些有签名可以练习下反编译找出签名算法,有的接口有 AES 之类加密反编译找出 key 解密。
入门可以参考下 you-get ,不过里面一般做的都比较简单直接,格式清晰度并不是很全,基本都是 web 接口。
感觉做垂直爬虫能从带签名带加密,甚至非 http 自定协议里抓到数据,是个很必要的技能。
2016-11-30 08:36:51 +08:00
回复了 skyboy 创建的主题 问与答 mysql 字符集和引擎的选择
🤔 iOS 输入法默认带的表情就是 emoji ,大家说的 tokudb 是指 MySQL 用的 tokudb 存储引擎
2016-11-30 08:28:28 +08:00
回复了 skyboy 创建的主题 问与答 mysql 字符集和引擎的选择
utf8mb4 才能支持 emoji ,既然是评论网站一定需要处理 emoji
自己维护的话 percona 会更 dba 友好
innodb ( xtradb )从各方面来说是默认的最好选择,但是要用对,不要主键乱序搞的插入页分裂,特定场景 tokudb 有很大的优势
1  2  3  4  5  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1073 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 36ms · UTC 20:08 · PVG 04:08 · LAX 12:08 · JFK 15:08
Developed with CodeLauncher
♥ Do have faith in what you're doing.