[实习] [今日头条] 数据抓取实习生
简历发送至:
[email protected] "姓名+职位+渠道+一周可实习几天+实习几个月”
职位描述:
1、目标是从互联网海量信息中抓取并筛选出有价值的内容,并转换为适合移动端展示的格式以推荐给用户,涉及到的环节包括爬虫,抽取,去重,质量识别等;
2、主要工作集中在爬虫和抽取环节;
3、由于需要覆盖大量长尾数据,对内容的精确抽取涉及到非常多的挑战;
4、帮助头条覆盖更多的内容,并将内容以更加精准的形式展现给用户。
职位要求:
1、对技术有热情, 既有高远目标,也能脚踏实地
2、有扎实的数据结构和算法功底, 强悍的编码能力
3、熟悉 linux 开发环境,熟悉 C++和 python 语言的优先
4、理解 http,熟悉 html、DOM、xpath 优先
5、每周出勤至少 4 天,实习期至少保证 6 个月,出勤多以及可长期实习者优先。
[工作福利] :
弹性工作;超丰盛免费三餐&下午茶、租房补贴、免费健身房;扁平管理、淡化层级;团队氛围好,不定期 TB ……
[工作地点] :
北京市海淀区北三环西路 43 号 中航广场 1 号楼 今日头条