V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
bitinn
V2EX  ›  Node.js

doc-sniff,解决请求返回不正确 content-type 的 node.js 库

  •  
  •   bitinn · 2015-01-30 04:52:40 +08:00 · 2038 次点击
    这是一个创建于 3375 天前的主题,其中的信息可能已经有所发展或是发生改变。

    专职分辨日常抓取的html/xml,因为不方便用后缀名和magic number猜;现实简化的whatwg mimesniff spec算法。

    不过这个算法到底有多准我还不确定,欢迎大家找实际案例帮忙测试。这种代码应该是很常写的,但是大家遇到的变态页面情况都不同,希望通过协作找到适合99.99%案例的算法。

    https://github.com/bitinn/doc-sniff

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1013 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 19:04 · PVG 03:04 · LAX 12:04 · JFK 15:04
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.