V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
zwzmzd
V2EX  ›  问与答

wget 怎么多进程下载列表文件

  •  
  •   zwzmzd · 2014-12-22 16:33:57 +08:00 · 5128 次点击
    这是一个创建于 3625 天前的主题,其中的信息可能已经有所发展或是发生改变。
    是这样的,爬了一堆图片的url,存在了一个列表list.txt里

    直接使用wget -i list.txt,可以顺序地下载图片。可是我希望wget能够启动10个worker来完成这个列表的下载任务(每个图片不需要多线程),查了man没找到相关的选项,大家有什么解决方案吗?
    9 条回复    2014-12-23 11:29:22 +08:00
    jackysc
        1
    jackysc  
       2014-12-22 16:52:31 +08:00
    用curl
    line
        2
    line  
       2014-12-22 17:12:28 +08:00
    之前,我都是分割文件,然后再下的。等更优方案
    mogging
        3
    mogging  
       2014-12-22 17:25:13 +08:00
    果断Axel啊
    imn1
        4
    imn1  
       2014-12-22 17:51:04 +08:00   ❤️ 1
    我是自写 python 多开 wget 进程
    aria2c支持多线程,你可以改用aria2c下载
    ToughGuy
        5
    ToughGuy  
       2014-12-23 00:04:38 +08:00   ❤️ 1
    ariac -c -sNUM -xNUM -jNUM -i url.txt

    -j 参数是设置并发下载数量
    ToughGuy
        6
    ToughGuy  
       2014-12-23 00:06:14 +08:00
    @ToughGuy

    ariac 打错, 应该是aria2c。
    aria2c 绝对好用哦。
    zwzmzd
        7
    zwzmzd  
    OP
       2014-12-23 00:31:21 +08:00
    @line
    @imn1
    @ToughGuy
    aria2c满足要求,aria2c -i list.txt -j2,不过man中-j选项的解释有点模糊


    @jackysc
    @mogging
    这两个软件我看了下好像不行
    ToughGuy
        8
    ToughGuy  
       2014-12-23 00:37:18 +08:00
    @zwzmzd

    Set maximum number of parallel downloads for every static (HTTP/FTP) URL

    注意到 every static ... URL 就够明显了。
    imn1
        9
    imn1  
       2014-12-23 11:29:22 +08:00
    aria2c很强大,可以http/ftp/webservice/bittorrent
    控制线程有两个参数,一个控制并发任务数,另一个控制每任务拆分的线程数(-j)
    http://aria2.sourceforge.net/ 官网上有手册,应该比man容易理解些
    aria2c可以写多个conf,用命令指定一个载入
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2914 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 12:10 · PVG 20:10 · LAX 04:10 · JFK 07:10
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.