NexT标签云配置
创新港体育场馆自动预定
Hexo本地写作环境配置
NLP工具NLTK的安装及使用
nltk简介
NLTK是构建Python程序以使用人类语言数据的领先平台。它为50多种语料库和词汇资源(如WordNet)提供了易于使用的界面,还提供了一套用于分类,标记化,词干化,标记,解析和语义推理的文本处理库。NLTK是Python上著名的⾃然语⾔处理库 ⾃带语料库,具有词性分类库 ⾃带分类,分词,等等功能。
社会心理学(一)
摘抄
2021.04
矫揉做作地喜好各种规矩就是“有系统”,孜孜不倦且兴致勃勃地处理鸡毛蒜皮的公事就是“勤勉”;该做的事优柔寡断就是“谨慎”;不该做的事盲目地坚持到底就是“决心”。
-- 《银河帝国2:基地与帝国》
Vue学习笔记
Vue
与Flask一起使用时的注意事项
Vue与Flask一起使用时会出现冲突,更改配置即可解决。
- Flask
1 | if __name__ == '__main__': |
- Vue
1 | new Vue({ |
Scrapy爬虫相关
请求伪装
在爬取腾讯天气时,发现无法成功爬取到天气数据,经过尝试发现是请求头除了问题。爬虫在爬取网页时的默认请求头为:
这种默认的请求头在爬取很多网站时会被禁止,无法获取到网页数据,因此需要使用请求头伪装,让网站认为是浏览器在访问。操作步骤如下:
爬取B站所有番剧数据并进行数据分析
简介
Bilibili(以下简称B站)中有大量的番剧版权,截止目前一共有3161部。每一部番剧都可以找到它的播放量,追番量,弹幕数量等播放数据,除此之外,每部番剧还有其相应的标签(如“漫画改”,“热血”,“搞笑”)。本项目旨在分析番剧播放数据与番剧标签之间的关系,同时也是一项数据分析的大作业,采用APriori频繁项集挖掘进行分析。
GitHub地址:https://github.com/KezhiAdore/BilibiliAnimeData_Analysis
码云地址:https://gitee.com/KezhiAdore/BilibiliAnimeData_Analysis