0.0.68 • Published 6 months ago

doc-dl v0.0.68

Weekly downloads
-
License
ISC
Repository
-
Last release
6 months ago

doc-dl

根据输入的文章url 抓取页面内容,并转成markdown,连同文章中的图片也给保存到本地

example

安装

npm install -g doc-dl
Usage: index [options]

Options:
  -V, --version         output the version number
  -u, --url <url>       文章url
  -t, --title <title>   自定义文章标题
  -d, --dir <path>      生成的目录(eg: -d res)
  -i, --img-dir <path>  生成目录内图片目录(eg: -i ./img/20)
  -l, --lax             puppeteer的waitUntil对应的值, 宽松的请求[domcontentloaded, networkidle2], 默认严格的请求[load, networkidle0]
  -h, --help            display help for command

Examples:
  $ custom-help --help
  $ custom-help -h

使用

url文章链接支持大部分网站,如掘金/知乎文章/微信公众号文章...

doc-dl -u <url>

注意

  • 一些网站等待时间过长可尝试 -l 参数, 部分网页可能持续的发起请求,改用宽松的请求规则可能成功

实现原理

  1. 使用Puppeteer爬取url中的html内容
  2. @mozilla/readability解析出html中的文章内容和标题
  3. 使用turndown将html的文章内容装成markdown
  4. 将解析出来的markdown中的图片下载并更新markdown中的图片路径
0.0.68

6 months ago

0.0.66

6 months ago

0.0.67

6 months ago

0.0.65

8 months ago

0.0.64

11 months ago

0.0.62

1 year ago

0.0.63

1 year ago

0.0.61

1 year ago

0.0.60

1 year ago

0.0.51

1 year ago

0.0.52

1 year ago

0.0.53

1 year ago

0.0.54

1 year ago

0.0.56

1 year ago

0.0.57

1 year ago

0.0.58

1 year ago

0.0.50

1 year ago

0.0.59

1 year ago

0.0.49

1 year ago

0.0.47

1 year ago

0.0.48

1 year ago

0.0.46

1 year ago