Loading...
本文翻译自 Felix Geisendörfer 的博客文章《Understanding node.js》。当我向别人介绍 Node.js 时,人们通常有两种反应,要么很快就理解了,要么最终还是很困惑。如果你属于后者,听听我对 Node 的解释:Node 是一个命令行工具,你可以用它来下载压缩包,编译和安装源代码。它可以运行 JavaScript 项目(通过在终端执行 node my_app...
平时逛知乎的时候,经常能看到很多很棒的图片,精美的壁纸,搞笑的表情包,有趣的截图等等,总有想全部保存下来的冲动。于是在一个小老弟的拜托之下,我把之前的知乎爬虫改造了一下,改装成了一个可以下载知乎回答中全部图片的新爬虫。1. 分析网站知乎的网站我们已经爬取过很多次了《Python 网络爬虫实战:爬取知乎一个话题下的全部问题》《Python网络爬虫实战:爬取知乎话题下 18934 条回答数据》《...
本书致力于教会你如何用Node.js来开发应用,过程中会传授你所有所需的“高级”JavaScript知识。本书绝不是一本“Hello World”的教程。
我们知道,在抖音APP中下载到的视频是有水印的,这就催生出了很多抖音短视频去水印的解析网站,小程序等。所以说,抖音短视频去水印这个东西并不是什么新鲜玩意儿,甚至你可以很轻松的在网上搜到抖音去水印的程序源代码。本文主要是从爬虫程序的角度,讲解遇到这样的问题我们应该如何分析,如何抓包,如何一步步写出自己的爬虫,让大家明白去水印的接口是怎么找到的,网上的代码是怎么写出来的。我会尽量讲解细致一些,争...
前几天受一个粉丝所托,爬取《南方周末》网站上的新闻文章。要求也并不复杂,跟 人民日报爬虫 和 解放日报爬虫 类似。话不多说,我们直接开始。1. 分析网站南方周末,网站地址为:http://www.infzm.com/contents?term_id=1观察网站主页,我们可以了解到,网站左侧为 频道列表 ,中间为 新闻列表 。鼠标点击切换左侧的频道时,观察到浏览器地址栏中 term_id 的值...
安装编译依赖:# 在命令行中进入引擎路径 cd E:/engine # 安装 gulp 构建工具 npm install -g gulp # 安装依赖的模块 npm install编译:gulp build-dev # 出现 JavaScript heap out of memory 的报错,执行以下命令解决 gulp build-dev --max-old-space-size=8192或...
我们在开发网站或者网页游戏中通常需要存储用户数据,实现一些功能,比如记住密码,自动填入信息,一段时间内账号免登录等。这些数据需要存储在浏览器中,常用的存储方式有以下几种:Local Storage、Session Storage、Cookies 。1. Local StorageLocal Storage 的值能永久的存储在浏览器上,直到手动清空浏览器数据。同一个浏览器,同一个域名下,存储数...
前段时间受哥儿们所托,爬取贴吧某帖子里的高清图片。事情是这样的,我哥们发现被贴吧中有好多漂亮的图片,想下载原图做壁纸,但是帖子里图片太多了,他全都要,于是想让我帮忙写个爬虫,批量下载下来。要求只有两个:下载原图实现批量下载话不多说,直接开始。1. 分析网站哥们提供的帖子地址: https://tieba.baidu.com/p/6516084831 。先分析 url 组成,我们可以猜到 65...
FairyGUI 的富文本组件中,支持 UBB 语法,我们可以通过它来很方便设置文本的样式,插入图片,超链接等,进行 图文混排。不过,很多时候内置的标签并不够用,需要我们自定义标签。1. UBB 常用标签普通文本不支持语法中的img、url标签,因为普通文本是不可以图文混排的。要支持图文混排,改为使用富文本。1.1 图片[img]image_url[/img] 显示一个图片这里的 image...
1. 获取当前目录下的所有文件可以使用 os.listdir(path) 函数,它可以返回 path 指定的文件夹包含的 文件 或 文件夹 的名字的列表。使用方法如下:import os # 打开文件 path = "D://data/" dirs = os.listdir( path ) # 输出所有文件和文件夹 for file in dirs: print...