0%

项目由来

创新港羽毛球场馆每天的预定需求较大。在线预定系统每天早上 8:40 左右开放,并且开放时间不定。这些因素给手动预定场馆带来了很大的麻烦,因此考虑由脚本自动化实现场馆预定过程。

阅读全文 »

写作缘由

由于经常换电脑设备,每次更换设备时都需要重新配置Hexo环境,故对配置流程进行记录,以供后续使用。

阅读全文 »

nltk简介

NLTK是构建Python程序以使用人类语言数据的领先平台。它为50多种语料库和词汇资源(如WordNet)提供了易于使用的界面,还提供了一套用于分类,标记化,词干化,标记,解析和语义推理的文本处理库。NLTK是Python上著名的⾃然语⾔处理库 ⾃带语料库,具有词性分类库 ⾃带分类,分词,等等功能。

阅读全文 »

2021.04

矫揉做作地喜好各种规矩就是“有系统”,孜孜不倦且兴致勃勃地处理鸡毛蒜皮的公事就是“勤勉”;该做的事优柔寡断就是“谨慎”;不该做的事盲目地坚持到底就是“决心”。

-- 《银河帝国2:基地与帝国》

阅读全文 »

Vue

与Flask一起使用时的注意事项

Vue与Flask一起使用时会出现冲突,更改配置即可解决。

  • Flask
1
2
3
4
if __name__ == '__main__':
app.jinja_env.variable_start_string = '[['
app.jinja_env.variable_end_string = ']]'
app.run(debug=True)
  • Vue
1
2
3
new Vue({
delimiters: ['[[',']]']
})

请求伪装

在爬取腾讯天气时,发现无法成功爬取到天气数据,经过尝试发现是请求头除了问题。爬虫在爬取网页时的默认请求头为:

这种默认的请求头在爬取很多网站时会被禁止,无法获取到网页数据,因此需要使用请求头伪装,让网站认为是浏览器在访问。操作步骤如下:

阅读全文 »

简介

Bilibili(以下简称B站)中有大量的番剧版权,截止目前一共有3161部。每一部番剧都可以找到它的播放量追番量弹幕数量等播放数据,除此之外,每部番剧还有其相应的标签(如“漫画改”,“热血”,“搞笑”)。本项目旨在分析番剧播放数据与番剧标签之间的关系,同时也是一项数据分析的大作业,采用APriori频繁项集挖掘进行分析。

GitHub地址:https://github.com/KezhiAdore/BilibiliAnimeData_Analysis

码云地址:https://gitee.com/KezhiAdore/BilibiliAnimeData_Analysis

阅读全文 »