1.3.1 • Published 4 years ago

@pot-code/novel v1.3.1

Weekly downloads
-
License
MIT
Repository
github
Last release
4 years ago

描述

有关小说阅读的 CLI 工具套件

安装

npm i -g @pot-code/novel 

使用

novel <command> [option]

已有的 command:

  • download

download

下载(抓取)小说资源,需要提供一份配置文件。可选项:

  • --config,-c,指定配置文件路径
  • --out,-o,指定输出文件,默认导出到当前执行命令的目录,文件名为 out.txt
  • --template,让 CLI 工具导出一份空配置文件,默认导出到 stdout,该选项和 --config 不能同时出现,择其一使用
  • --worker,-w,设置抓取的线程数(不超过 CPU 的最大线程数)。多线程抓取,速度更快,仅支持 config 文件提供了 catalog 部分的情况。注意散热,抓取过程 CPU 占用较高,过热容易导致抓取失败、报错
  • --debug,-D,设置 headless 为 false,方便排查问题
  • --path,-p,手动指定 chrome 的执行路径(如果自带的扫描路径不满足需求的话)

配置文件说明:

{
  "manual":{
    "url": "", // 要抓取小说的第一章(或其他章节作为开始的)网址,和 next 属性必须成对出现
    "next": "", // 下一章节按钮的选择器,要求元素类型为 anchor 类型,且包含正确的 href 值,暂不支持 js 驱动的按钮元素
  },
  "catalog": { // 也可以直接提供目录所在网址,优先级比 manual 要高,两者可择其一出现
    "url": "", // 目录网址
    "selector": "", // 章节列表每个章节条目元素的选择器,要求元素类型为 anchor 类型,且包含正确的 href 值,暂不支持 js 驱动的按钮元素
    "skip": 0 // 跳过多少个章节(从开头算起)
  },
  "title": "", // 文章页面标题所在元素的选择器
  "content": "", // 文章页面内容所在元素的选择器
  "limit": 0, // 限制抓取章节个数,-1 为不限制
  "wait": 0, // 每次抓取的等待间隔,用于反反爬虫
}
1.3.1

4 years ago

1.3.0

4 years ago

1.2.1

4 years ago

1.2.0

4 years ago

1.1.2

4 years ago

1.1.1

4 years ago

1.1.0

4 years ago

1.0.1

4 years ago

1.0.0

4 years ago