一、间歇性404问题的解决

上周开始,手机就频繁收到报警通知,一会儿提示博客异常HTTP返回状态码为404,一会儿又提示恢复正常HTTP返回状态码为200,简直烦不胜烦。

当时工作很忙而且判断这个问题并不容易解决,索性就没花时间去研究,等到这周双休再拿出大块时间来研究解决下。今天早上起来后,Jefferson终于准备看下这个问题。

1. 重现404问题,根据log排查原因

Read More →

一、Jupyter Notebook是什么

Jupyter Notebook ,源自IPython Notebook,是一个交互式、支持多种编程语言的笔记本(以下简称Jupyter)。Jefferson目前只用它写过Python代码,因此下文相关叙述均可认为是Jupyter for Python。

二、Jupyter可以做什么

不同于Notepad++、Sublime Text、Vim等工具,Jupyter是基于Web浏览器工作的。也就是说我们将代码写在浏览器打开的一个页面里,然后在页面上发送代码执行命令,代码执行结果依然会显示在这个页面上,同时Jupyter Notebook会将所有的代码、数学公式、图表、输出结果等都保存起来。

三、怎么用Jupyter

Jupyter使用IPython解释执行Python代码,因此如果你想使用Jupyter,你得安装IPython。官方推荐 安装Anaconda,Jefferson也是安装的Anaconda,安装完之后,在终端输入:

ipython notebook

即会在浏览器中打开Jupyter的页面。 Read More →

上篇文章Jefferson有提到过,对于站长来说,要想完全解决被劫持的问题,可行的办法就是全站上https。本文就分享下WordPress站点全站免费升级到https的方法。

为什么要升级

要回答这个问题,就要先了解下https是什么。

HTTPS,英文全称为HyperText Transfer Protocol Secure,中文译为超文本传输安全协议。相比我们常见的HTTP,HTTPS可以保证互联网通信双方数据交换的隐私和完整性。比方说,使用HTTP的网站,用户与之交互过程中的数据传输是明文的,中间链路上的嗅探者能轻易窃取或篡改传输内容,这也是运营商通过劫持流量后可以做到插入广告的原因。而使用HTTPS的站点,用户端与服务端通信之前需要先通过安全认证,之后每一步数据传输都是加密的,中间链路上的嗅探者无法获取实际传输的内容,更别说加以篡改而强制插入广告了。

既然清楚了HTTPS的好处,下边以CentOS + nginx为例WordPress站点升级到HTTPS的一些步骤。 Read More →

一、背景

可能Jefferson之前在互联网广告行业的缘故,所以对广告一向比较敏感,偶尔可以看到CPS渠道商劫持自然搜索流量,或是宽带运营商劫持强插广告的情况。然而最近的一些事情,让我对广告劫持及其应对方法更加感兴趣起来。

先是GA 持续报警页面加载时长过长(Jefferson设置的是当天平均6s以上报警),这个起初也没有在意,因为博客放在海外VPS上,连接时长相对较长,加之服务端也没做什么缓存优化,所以平均6s也不奇怪,毕竟之前也常有嘛。但是最近一两个月报警的频率越来越高,这个就真让我下决心有时间要好好优化下了。 Read More →

Update:2016.03.26 发现有伪装成googlebot的client,严格筛选进入爬虫信息统计的日志,增加请求类型为GET的条件&& $2~/GET/ 。

一般来说,搜索引擎爬虫不会执行页面上的JavaScript代码,而网站分析工具 大多又是基于JavaScript代码的,这也就是说,默认情况下,网站分析工具不能记录到搜索引擎爬虫这部分的流量。但搜索引擎爬虫数据对于SEO又是非常的重要,那么如何才能拿到搜索引擎爬虫对网站的爬取数据呢?方法可能有很多,比如直接从网站服务器日志中来统计爬虫信息。本文以nginx日志为例,来说明如何从中提取出爬虫信息。 Read More →

刚开始因为想要找一款日志分析的工具,想起Piwik便有此功能,于是找来看看。一阵折腾,虽然尚没用上日志分析,不过却把Piwik的环境搭建好了,也算有所收获。所以本篇就简单介绍下Piwik的安装,希望对您有用。

一、简单介绍

首先还是介绍下Piwik。GA、百度统计、CNZZ在国内都很有名,但是说起Piwik,知道的人却并不多。然而,根据W3Techs的数据,全球范围内使用Piwik的网站还是相当多的,在调查中的几十款网站分析工具中,Piwik的使用占比高居Top 10. 需要特别提到的是,Piwik免费开源,支持数据私有,也支持全平台(Web、Android、iOS等)的数据统计,另外,还支持日志分析。 Read More →

拥有一个独立域名下的个人站点,是我一直以来想完成的一个心愿。跌跌撞撞的,现在这个博客已经基本成型,希望之后我能好好维护这个博客,让自己的2015年因此而变得不一样!

之前纠结了很久,不知道第一篇博客该写些什么内容,最终还是决定写写打造这个站点过程中的一些事吧,在此过程中我走过的坑和学习到的东西,我认为还是有价值的。希望这篇文章能对您有所帮助。

一、建站准备工作

1. 域名注册

首先,选择域名注册商。到网上查了下,一致推荐GoDaddy,So,GoDaddy !

然后想好一个域名,并验证是否可用。现在好记的.com 域名基本被注册了,如果仅作个人博客之用,不注册.com的好用的名字还是有的。

走完以上两步,即可在相应域名注册商提交你的订单,完成注册!顺便说下,GoDaddy 是支持支付宝的,但是操作界面真心让我抓狂……

2. 购买VPS

先搞清楚这几个概念,虚拟主机、VPS、独立主机。这里有张图说明了这三者的差异。 Read More →