LOADING

加载过慢请开启缓存 浏览器默认开启

cy’s Blog

战战兢兢被生存驾驭 安安静静看自己过期

Selenium工具类说明

Selenium 2024/7/30

Selenium工具类说明:本仓库为selenium脚本封装库,利用python装饰器以及闭包思想,致力于更好的调试自动化爬虫,让爬虫技术更好入门

阅读全文

Selenium爬虫脚本使用举例(以百度为例)

Selenium 2024/7/30

Selenium爬虫脚本使用举例(以百度为例):简单易上手,对于新手或者是在机器学习获取数据方面遇到困难但不想在爬虫深入的同学及其友好,在爬取少量样本或网页没有反爬时十分好用——使用selenium爬取的时候,可以使用jupyter一步一步调试,直接通过开发者模式抓取网页中元素,对收集网页文本中的任务比如微博情感分析,简单地抓取图片等比较方便,拿来即用,调试的过程中直接就保存结果了,可以绕过一些普通的反爬。

阅读全文

不蒜子给网站、博客文章添加阅读次数统计

博客 2024/7/17

满足以下小小的虚荣心,想看看有多少人来访问我的博客,一开始用的百度统计,然后发现它…….确实能统计,但是也只能统计,应该是有api给我接入的,但是找了这么多教程没看到,我也没在百度统计的官方文档中找到,可能因为我是免费版吧。后面看了其他教程发现不蒜子这个库还行,便用这个试了以下,效果还行

阅读全文

github博客搭建(六)—— cdn加速

博客 2024/7/15

经过前面的步骤,相信你已经能够挂访问github.io了,但是分享链接给别人的时候,访问起来很慢,这个时候就得利用cdn加速,cdn具体原理我就不具体阐述了。

阅读全文

解决hexo_command_not_found环境问题

解决hexo: command not found环境问题

阅读全文
1 ... 5 6 7 ... 8
avatar
cy

数据分析师,NER工程师
精通NER————标注
精通pytorch————安装与卸载
精通linux————开关机
熟练使用selenium爬虫

本站访客数人次 本站总访问量