大家好,我是小小明。
今天大家期待已久的热榜追踪神器上线了,包含历史热榜搜索器和近两日热榜排名等。
历史热榜追踪数据搜索:http://120.78.229.124:8000/static/search.html
热榜涨粉榜top50:http://120.78.229.124:8000/rankfollow/
下面我们分别来看看这两个网页:
打开网页后界面如下:
该网页默认展示最近上榜的20条数据,我们可以通过搜索找到我们需要的数据。
例如我们想查看昵称中包含java的用户上榜情况,可以再昵称输入框输入java后回车:
可以看到上榜时间,小时数,以及在热榜期间的涨粉量都一目了然。我们可以通过表格组件对查询结果进行二次排序:
这就是按涨粉量排序后的结果。
当前目前我截图的数据热度链接比较长,我目前已经更新按照万为单位保留一位小数进行追加。
还可以搜索近20条标题包含python的上榜数据,多个条件也支持组合查询。
关于排名有一些搜索小技巧,这里的排名是根据排名链接进行搜索的,我们可以根据条件搜索近期上过榜一的文章(不包含仅一上榜就到榜1的):
注意:上榜时长为null表示该条数据当前还在热榜中。
我们还可以通过搜索上过榜前9的数据:
最后根据日期我们可以搜索指定日期上榜的数据,例如搜索11月4号上过榜前9的数据:
在另一个页面http://120.78.229.124:8000/rankfollow/则显示今日热榜的涨粉top50:
继续往下划还可以看到昨日热榜涨粉top50:
然后可以看到历史热榜涨粉top50:
目前历史涨粉榜情况不佳是因为数据库重建后,采集程序昨天下午2点才重新启动。再过一星期,相信大家都能看到一个完全不一样的历史涨粉热榜。
最下面还有一个模块:
不过从昨天下午两点到现在还没有人能连续两次上榜,相信过两天后,我们能够看到上榜次数超过2次的用户出现。
相信很多小伙伴更好奇该程序如何开发,那么下面我简单介绍一下该程序的开发思路与代码。
思路:有一个采集程序每小时执行一次,每次执行都获取当前热榜和历史热榜进行差异比较,划分为三类:
- 同时存在当前热榜和历史热榜中,说明是正在热榜的数据
- 不在当前热榜均在历史热榜中,说明是已下榜的数据
- 在当前热榜不在历史热榜中,说明是新上榜的数据
对于这三类数据,有不同的处理策略:
- 对正在热榜的数据追加更新排名链路和热度链路
- 对已下榜的数据,根据链接逐条采集当前粉丝数,填入下榜粉丝数字段中;同时根据当前时间更新下榜时间。
- 对于新上榜的数据,根据当前时间填入上榜时间,采集当前粉丝数填入上榜粉丝数字段中。
对于新上榜的每条数据,使用文章ID作为主键进行存储。
下面是以上思路的完整代码:
restful接口开发:
虽然本程序完全无所谓SQL注入,但是防SQL注入还是得养成习惯,这里我就简单粗暴的采用了去掉查询条件中引号和分号来达到防SQL注入的目的。当然这种方法也可能一些特殊的方案防不住,期待大佬们能够指出。
前端展示页开发:
这里我使用了vue进行数据绑定,这样就可以大幅度简化代码,原本几十行Javascript代码才是实现的动态数据修改变成了这一行。而且HTML部分的代码也变得和后端模板渲染的代码类似,非常方便。
排名页面的写法比较简单粗暴,直接模板渲染。后端视图代码:
四个SQL获取了四个部分的数据,然后模块渲染代码大致都是如下格式:
本文地址:http://lianchengexpo.xrbh.cn/quote/9547.html 迅博思语资讯 http://lianchengexpo.xrbh.cn/ , 查看更多