Loading...
上一篇《人民日报》的爬虫文章发布之后,收到了很不错的反馈,文中的爬虫代码也确实帮助到了很多人,我很开心。跟读者们交流过程中,我也发现了一些比较共性的需求,就是 根据关键词筛选 新闻文章。最初我的想法是,在爬取到全部文章数据的基础上,遍历文件夹,然后将正文中包含关键词的文章筛选出来。如果你已经下载到了完整的新闻数据,那用这种方法无疑是最方便快捷的。但是如果没有的话,需要先爬取全部数据,再从中筛...
本代码用于爬取自由时报新闻网站首页的新闻文章,包括新闻标题,新闻链接,和发布日期三个数据
本代码用于自动生成个性化语录桌面壁纸。