我只是个RSS爱好者,花点小钱,办个小站,为有缘人服务。
我不是程序员,我也不想深入Linux,nginx,php等等那些并不很感兴趣的技术。
RSS全文订阅
昨天做测试不小心弄错了,在那个时间段访问的朋友会收到抓取频繁的通知,不用担心。
为什么要测试呢,看上图。
昨天总共用去33G,是近几天最少的。我用的是最便宜的主机,每月1000G,简单乘一下就知道,一定是超了。
暂时的忍耐度是2%,超过的会收到抓取频繁的信息提示修改设置。受影响的非常少。
说过太多次了,我去抓别人网站最多也就是半小时一次,你分分钟都来更新,只是更新了个寂寞。(此话基本针对有自己服务器的,这前几位已经占去10%以上的流量,可供参考的feedly只用了60m左右)
不想升级,没钱。
https://feedx.net/%e6%8a%b1%e6%80%a8%e4%b8%80%e5%8f%a5%ef%bc%9a%e6%81%bc%e4%ba%ba%e7%9a%84%e8%81%94%e5%90%88%e6%97%a9%e6%8a%a5
今天偶然发现香港代理叒起作用了,可以得到全文,但也不打算把早报从“丢弃”分类解放出来了,来来回回的,心累。
早报抓取的是今日焦点和单日排行。
订阅地址 https://feedx.net/rss/zaobao.xml
不能保证一直可用,参见上面的抱怨。
最近的几个RSS都是红红的。
大家各取所需。
联合早报又没更新。
发现并不是代码的问题。
有的网站是肯定抓不到全文的,这点咱服,玩不起的躲着。最烦的就是联合早报这种留下了种种漏洞让你能抓到全文的,最近的方法又不行了。
早报其实还算良心,订户专区的文章本来就不多,但谁让咱有强迫症呢。
之所以说又,把我能想起来的抓取过程念叨一下:
1.文件头head里藏着,虽然是全文,但没有格式,费挺大劲格式化这字符串。
2.一些在线博彩网站可能为了引流,会镜像联合早报的所有新闻,用过一段时间,总觉得膈应,现在也没有这类网站了。
3.发现用中国大陆代理可以免费看订户专区,并且跟官网的都不是一套代码。说明它有判断用户来源来分配不同网页。用了很长一段时间。
4.大陆代理失效,什么也看不到了,偶然发现香港代理还是能得到全文。
这几天不更新了,即使用代理,也和官网看到的是一样的代码了,说明它关掉了这个福利。
其实早就发现了uzaobao.com这个网站,它不是简单的镜像(要不早就用了),还自己改了标题,但正文内容应该是一样的,我对比过。为了全文,可能会启用这根最后的稻草了。
有洁癖的知悉一下,早报的文章将来并不是来自官网。
这世道,一言难尽。
一场肺炎,各路牛鬼蛇神悉数登场。
昨天一直在折腾,服务器没有能用的,换一个封一个。还把网友留的言给弄没了。
这世道,自求多福。
太长时间没登录网站看看了……
一些在免费空间上放的源(help.feedx.net)都没了,没备份。主站的一些源也失效了,有些答应做的源没有做。
精力是真有限,不过放心,会在的,会继续维护的。
本小站用的vultr,一直属于凑合能用的状态,说好不好,说坏不坏。主要是换IP很方便,IP墙了可以很快换一个,这点很好。
这两天奇慢无比,本想换个节点,结果无一能用。还以为卅年前的事过去了呢,原来刚刚震荡到我这里,MD。
feedx.co可能随时不能访问,那得看皇恩有多浩荡了。
老爷子一向身体很好,上月末大病,检查结果让人崩溃。
开始瞒着老爷子,只有我姐和我扛着,表面还要装得很轻松。瞒是瞒不住的,老爷子心态还好,生死看淡,还总安慰我们。
这一个月,总是做梦。