这个阶段按说大白早该出场了,踹门、撬锁,就怕大伙没药吃。

回归

老爷子病情暂时稳定。
刚看了看,好多更新异常的😭
假期完成了个小手工,喜迎二十大。

斧头劈开新世界,镰刀割断旧乾坤

继续

几个月未登录

老爷子又住院了,希望别在医院过年。

等有时间再处理网站问题。

各位,身体很重要,多多锻炼,多保重。

哪里的问题?

突然间好几个国内网站不能抓取了,超时。

暂时的解决办法是设置了代理,可能以后还会有更多的国内源出问题。

有需求的会尽快解决

近一个月还挺忙,都没怎么上网站看一眼。

答应做的需求也没做;早报又挂了;618买个电动工具还不发货,北京担心我拿个电动工具袭击国家领导人吧。其实您是多虑了,多点自信吧,别只挂在嘴边。

再次申明封ip的情况,只有在忍无可忍的时候才会封。目前长期封的一个巴掌就能数得过来,正常使用的是绝对不会在里面的。

善良如我——漫漫封禁路

我只是个RSS爱好者,花点小钱,办个小站,为有缘人服务。

我不是程序员,我也不想深入Linux,nginx,php等等那些并不很感兴趣的技术。

一个kindle才几G,存满了认真看几年都看不完。这个么小破站1000G流量居然不够用,行动起来,该封的封。 继续

枪打出头鸟

昨天做测试不小心弄错了,在那个时间段访问的朋友会收到抓取频繁的通知,不用担心。

为什么要测试呢,看上图。

昨天总共用去33G,是近几天最少的。我用的是最便宜的主机,每月1000G,简单乘一下就知道,一定是超了。

暂时的忍耐度是2%,超过的会收到抓取频繁的信息提示修改设置。受影响的非常少。

说过太多次了,我去抓别人网站最多也就是半小时一次,你分分钟都来更新,只是更新了个寂寞。(此话基本针对有自己服务器的,这前几位已经占去10%以上的流量,可供参考的feedly只用了60m左右)

不想升级,没钱。

早报叒回来了

https://feedx.net/%e6%8a%b1%e6%80%a8%e4%b8%80%e5%8f%a5%ef%bc%9a%e6%81%bc%e4%ba%ba%e7%9a%84%e8%81%94%e5%90%88%e6%97%a9%e6%8a%a5

今天偶然发现香港代理叒起作用了,可以得到全文,但也不打算把早报从“丢弃”分类解放出来了,来来回回的,心累。

早报抓取的是今日焦点和单日排行。

订阅地址 https://feedx.net/rss/zaobao.xml

不能保证一直可用,参见上面的抱怨。

抱怨一句:恼人的联合早报

联合早报又没更新。

发现并不是代码的问题。

有的网站是肯定抓不到全文的,这点咱服,玩不起的躲着。最烦的就是联合早报这种留下了种种漏洞让你能抓到全文的,最近的方法又不行了。

早报其实还算良心,订户专区的文章本来就不多,但谁让咱有强迫症呢。

之所以说又,把我能想起来的抓取过程念叨一下:

1.文件头head里藏着,虽然是全文,但没有格式,费挺大劲格式化这字符串。

2.一些在线博彩网站可能为了引流,会镜像联合早报的所有新闻,用过一段时间,总觉得膈应,现在也没有这类网站了。

3.发现用中国大陆代理可以免费看订户专区并且跟官网的都不是一套代码。说明它有判断用户来源来分配不同网页。用了很长一段时间。

4.大陆代理失效,什么也看不到了,偶然发现香港代理还是能得到全文。

这几天不更新了,即使用代理,也和官网看到的是一样的代码了,说明它关掉了这个福利。

其实早就发现了uzaobao.com这个网站,它不是简单的镜像(要不早就用了),还自己改了标题,但正文内容应该是一样的,我对比过。为了全文,可能会启用这根最后的稻草了。

有洁癖的知悉一下,早报的文章将来并不是来自官网。