0.0.68 • Published 6 months ago
doc-dl v0.0.68
doc-dl
根据输入的文章url 抓取页面内容,并转成markdown,连同文章中的图片也给保存到本地
安装
npm install -g doc-dl
Usage: index [options]
Options:
-V, --version output the version number
-u, --url <url> 文章url
-t, --title <title> 自定义文章标题
-d, --dir <path> 生成的目录(eg: -d res)
-i, --img-dir <path> 生成目录内图片目录(eg: -i ./img/20)
-l, --lax puppeteer的waitUntil对应的值, 宽松的请求[domcontentloaded, networkidle2], 默认严格的请求[load, networkidle0]
-h, --help display help for command
Examples:
$ custom-help --help
$ custom-help -h
使用
url文章链接支持大部分网站,如掘金/知乎文章/微信公众号文章...
doc-dl -u <url>
注意
- 一些网站等待时间过长可尝试
-l
参数, 部分网页可能持续的发起请求,改用宽松的请求规则可能成功
实现原理
- 使用
Puppeteer
爬取url中的html
内容 @mozilla/readability
解析出html中的文章内容和标题- 使用
turndown
将html的文章内容装成markdown - 将解析出来的markdown中的图片下载并更新markdown中的图片路径
0.0.68
6 months ago
0.0.66
6 months ago
0.0.67
6 months ago
0.0.65
8 months ago
0.0.64
11 months ago
0.0.62
1 year ago
0.0.63
1 year ago
0.0.61
1 year ago
0.0.60
1 year ago
0.0.51
1 year ago
0.0.52
1 year ago
0.0.53
1 year ago
0.0.54
1 year ago
0.0.56
1 year ago
0.0.57
1 year ago
0.0.58
1 year ago
0.0.50
1 year ago
0.0.59
1 year ago
0.0.49
1 year ago
0.0.47
1 year ago
0.0.48
1 year ago
0.0.46
1 year ago