工作职责:
- 理解项目需求,制定网络数据抓取规划,负责爬虫程序编写、数据清洗以及汇总
- 设计各种策略和算法,优化爬虫效率
- 构建通用可扩展的爬虫框架
基本要求:
- 3年以上开发经验,至少精通一门脚本语言(python/perl/ruby等)
- 了解HTTP协议和各种Web前端技术(HTML/JavaScript/AJAX等),熟悉正则表达式和XPath
- 熟悉至少一种数据库系统(SQL/NoSQL皆可)
- 扎实的编程基础和良好的编程习惯
- 良好的沟通能力
加分:
- 熟练使用一种开源爬虫框架(Scrapy/Nutch等)
- 具有分布式爬虫架构经验
工作地点上海徐家汇,北京国贸写字楼
公司网站:www.meritco-group.com
简历请投递至:
[email protected] 标题:[爬虫工程师]_姓名_工作年限
我们会在第一时间联系你