1
freed 2013-06-23 10:26:46 +08:00
XX小偷? 这类小偷程序应该可以吧..
|
2
shiweifu 2013-06-23 10:28:59 +08:00
写个爬虫不就行了
|
3
twamix 2013-06-23 11:01:58 +08:00
火车头 AND ET2
|
4
jjplay 2013-06-23 11:32:53 +08:00
http://www.demo2.org/ 高端反向代理采集
|
8
xieren58 2013-06-23 14:21:18 +08:00
http://www.17qingsong.com/ 全自动,无人值守
|
10
yaotian 2013-06-23 14:38:59 +08:00
刚搞得,连域名都没有。 10秒抓一次。
http://zhengyaotian.com:9999 |
11
huip 2013-06-23 14:51:31 +08:00
这个应该很容易实现吧,把抓取的数据存储到数据库,然后在写一个中间件就可以了。
|
13
lyklykkkkkkk 2013-06-23 15:04:23 +08:00
许多据说『月入几万』的垃圾站就是这么干的,收集文章+挂广告
|
14
xieren58 2013-06-23 15:24:05 +08:00
@lyklykkkkkkk 对呀,我的那小站,每个月也能赚点~学那么多,不能变现,那也是白学~谁让生在天朝呢。一套房子压死很多程序猿了~
|
16
xieren58 2013-06-23 15:42:25 +08:00
@yaotian 没多少,ip平时一般有3k,百度有10几块一天,加上有淘宝,亚马逊,一号店那些,一个月至少几百,上千,没啥问题~
|
17
akira 2013-06-23 17:31:37 +08:00
肯定可以啊。。。不然你以为各种垃圾站怎么来的,还有各种采集软件,都是谁买的
|
19
yaotian 2013-06-23 18:28:10 +08:00
上面介绍的那个临时的站大家就别访问了, 和域名连上了 http://sche.mobi/
|
23
huazhouji 2013-06-23 18:55:21 +08:00 via iPhone
垃圾站不是很容易被搜索引擎降权之类的吗?需要采集后做什么处理吗?还是采集的渠道有讲究?望赐教〜〜
|
24
efi 2013-06-23 19:20:04 +08:00
有没有可能自动抓取网上邮箱并自动向邮箱发送广告?
|
25
lovejoy 2013-06-23 19:20:16 +08:00
最讨厌这种网站,尤其是有些完全是关键字没有内容的网站
|
27
yaotian 2013-06-23 22:59:33 +08:00
@xieren58 真没看出来,不错。 我们建友情链接吧? 目前 http://sche.mobi 已经搞得相对满意了。
|
28
timothyye 2013-06-23 23:00:43 +08:00
这类的程序很多的
|
29
quake0day 2013-06-24 00:25:24 +08:00
这个自己写都不难,Python基础的urllib,urllib2库就能搞定。至于定时,用Crontab控制就行了。
|
30
zlwens 2013-06-24 00:44:12 +08:00
原来拉圾站是这么有搞头啊
|
31
PrideChung 2013-06-24 00:51:02 +08:00
建议你不要做这种无耻的行为。
|
33
tarsier 2013-06-24 01:25:46 +08:00 via Android
不是我自视清高,我觉得在这里讨论垃圾站采集站复制别人内容来赚钱的行为不好。
|
34
xiiing 2013-06-24 07:36:36 +08:00
网上原创文章并不多,很多门户网站也是转来转去的。转的时候加上来源是不是好一些?
|
35
zippera OP @PrideChung 想到这个问题时纯粹是从技术角度出发的,也想练练手。看到大家讨论才意识到有些垃圾站是这么来的。但是,美味阅读这样的网站不也是采集来的吗?
|
40
yaotian 2013-06-24 10:52:26 +08:00
|
42
PrideChung 2013-06-24 13:08:39 +08:00 via iPhone
@zippera 美味爱读的网摘是ugc,并非自动采集。不过我觉得这样还是有问题,因为无论网站还是用户都没有得到原文作者的授权。
按照著作权法,全文转载是需要经过作者首肯的,即使保留了署名也需要作者同意。 |