Nginx日志分析工具goaccess

时不时地会出现服务器cpu占用率100%的情况,基本到这时候php基本就全挂了,而出问题的也是php-fpm这个进程。说实话对于这个破进程真是没什么好的想法,进程数量怎么设置都不对,反正就是只要开机就各种卡。其实也考虑过是不是被攻击了,但是就这么个破网站,个人感觉攻击也没什么意思啊。图什么呢~~

通过top命令以及trace命令,没有找到什么有用的线索。不过通过查看访问日志可以看到每秒都有数条请求,这尼玛就很神奇啊,每天的访问量不过1k多点,怎么可能会每一秒都那么多请求呢。通过tail命令查看访问日志太蛋疼了,于是就想着找个更加可视化的工具,于是找到了goaccess:

GoAccess是一款开源的且具有交互视图界面的实时Web 日志分析工具,通过你的Web 浏览器或者 *nix 系统下的终端程序(terminal)即可访问。 能为系统管理员提供快速且有价值的 HTTP 统计,并以在线可视化视图。

Continue Reading

长续航按摩器改装

为了给小姐姐按腿,买了一个自动按摩器。更准确的说是一对按摩器。刚买来的时候就有一个续航一直不大行,同时充满电,一个能用3个小时,另外一个也就用半个小时就没电了。懒得换就只能经常充电。终于前天晚上,那个电量有问题的按摩器彻底罢工了,充不进电去,也开不了机。

本着不浪费的精神,于是我就把他给拆了,最终发现问题也很简单,充电电池鼓包了。很可能是质量问题。

Continue Reading

诡异的Google Fonts

最近打开博客后台的速度越来约慢了,已经到了让人无法忍受的地步了。之前已经通过litespeed cache插件进行了缓存,并且使用omgf进行了google fonts屏蔽。神奇的地方就在于,前台的加载速度基本不受影响,页面加载速度还可以,但是到加载完成依旧需要很长时间,需要等所有的数据加载之后浏览器的按钮才能重新变回刷新。调试了一下,发现首页的问题和内页的问题基本都是由于google fonts引起的,这就很奇怪了。是插件没生效?还是屏蔽不彻底?

Continue Reading

诱惑

生活对于某些人来说从来都不是一成不变,而诱惑也不是无中生有。星星之火可能就形成与那漫不经心的惊恐一撇,这一撇看到了一些让人血脉喷张的事情,也在内心中下了一颗萌动的种子,随时等着破土而出。尼采说过,当你在凝视深渊的时候,深渊也在凝视着你。之前对于这句话并没有太多的感觉,进而对于屠龙少年终成恶龙的论调也不屑一顾。
事情并不是总是那么的波澜不惊,之前对于各种色情内容的认知不过是日本,欧美的av。国产片基本都看不到,也许是因为语言,也许是因为肤色,也许是因为种族的问题。对于发生在欧美国家,日本等的各种小电影并没有什么过多的共情,觉得不过是一部色情影片而已,追求的也仅是感官和生理上的刺激。多年以前去泰国,去按摩的时候还想着能不能遇到人妖小姐姐,事实上并没有,给按摩的是一个大妈,手法很专业。按完了感觉也不错,说不上有什么失望,也说不上有什么惊喜。
前年开始,偶然的机会在一个论坛看到一篇分析福利app的帖子。在这之后,陆陆续续分析了数款福利app。然而并不是只是分析了算法,更深入的还爬取了各个网站的视频,把所有的数据收集到了一起(目前多数app加密算法都变了,数据不再增加)。
为了存这些数据,直接在亚马孙上开了一台服务器。基于这些数据也做了不少数据分析的文章。如果事情到此为止,可能也不会有任何的欲望。在分析完这些数据之后,还观看了无数的视频,也就是在这时候发现,现在国产色情影片的数量和拍摄速度异常惊人。也就是因为这,有无数的男性(从qq性别看)来加我,要麻豆区的视频下载地址。这也是为什么博客右侧用红字标注了不提供麻豆区视频下载,有了这条声明之后基本没有人加我qq来要视频了,整个世界清净了不少。

Continue Reading

美女图片整理工具 V1.0

 

不知道有没有和姐姐我一样把所有美女的图片都下载下来的,如果没有下载的话可以通过博客的搜索功能搜索爬虫去下载妹子图片了哦。通过爬取的乱七八糟的各种网站,目前粗略的估计所有下载的图片大约有1T左右了。由于各个网站都是分别的下载的,所有下载后的图片会有很多重复的。想找一个图片处理工具,找了半天有个什么推荐的eagle的工具,还是收费的,可以免费试用一个月。结果我把下载的图片目录加进去直接卡死了。啊哈哈。这就离谱,所以如果没有图片处理需求的还是推荐picasa3,我也有发布一个补丁工具,真的是一代神器。

既然没有现成的工具,那就写一个吧,具体的要求:

1.能够把所有文件复制到同一个目录下(这不是废话嘛,就是为了干这个的啊)
2.能够过滤10k以下的非图片文件(多数是由于被爬取网站不稳定导致的下载失败,其实不是图片文件)
3.对于不同网站下载的同一个图片不要重复复制(通过计算文件md5的方法进行规避)
4.能够记录整理日志(当然啊,不然那么多文件中间关机了,岂不是得全部再来一遍)
主要就是上面的几个要求啦~~~

Continue Reading

Python3 常用日期计算方法

后台做数据分析汇总的时候需要处理各种时间段,每天的零点、每周的第一天最后一天、每月的第一天最后一天等,不知道有没有现成的可用库来处理。搜索的基本也是各种其他人写的方法,我这里汇总了一下(抄了一些代码)。

日期处理一般会用到下面几个库:time,datetime,calendar。一般通过这几个库来处理时间也够用了。

time 模块

该模块包括使用时间执行各种操作所需的所有与时间相关的功能,它还允许我们访问多种用途所需的时钟类型。

Continue Reading

精品美女吧 爬虫【Windows】【22.12.23】

精品美女吧 爬虫
Verson: 22.12.23
Blog: http://www.h4ck.org.cn
****************************************************************************************************
USAGE:
spider -h <help> -a <all> -q <search> -e <early stop>
Arguments:
         -a <download all site images>
         -q <query the image with keywords>
         -h <display help text, just this>
****************************************************************************************************

Continue Reading