0.1.3 • Published 5 months ago
gibun v0.1.3
Gibun
Gibunは、日本語のフェイク文章を生成するライブラリです。
形態素解析とマルコフ連鎖を使用し、ある程度自然な文章を生成します。
GPTなどの生成AIを使用するほどでもない、テストデータ生成などでご使用ください。
インストール
kuromoji.jsと一緒にインストールします。
npm i -D gibun kuromoji.js
使い方
サンプル文章を設定して、生成します。
import { gibun } from 'gibun';
async function test() {
await gibun.train(
`
私はその人を常に先生と呼んでいた。だからここでもただ先生と書くだけで本名は打ち明けない。
これは世間をはばかる遠慮というよりも、そのほうが私にとって自然だからである。
私はその人の記憶を呼び起こすごとに、すぐ「先生」と言いたくなる。
筆を執っても心持ちは同じことである。
よそよそしい頭かしら文も字じなどはとても使う気にならない。
`
);
const result = gibun.generate({ minLength: 20, maxLength: 30 });
console.log(result); // 自然だからである。これは同じことである。私は同じことで本名は
}
test();
API
トレーニング
文章を渡します。
gibun.train(text: string | string[]): Promise<void>
例:
await gibun.train('吾輩は猫である。');
await gibun.train(['名前はまだ無い。', 'どこで生れたかとんと見当がつかぬ。']);
生成
文章を生成します。
- params
- minLength: 最小文字数
- maxLength?: 最大文字数
gibun.generate(params: { minLength: number, maxLength?: number }): string
例:
gibun.generate({minLength: 20, maxLength: 30})
サンプルデータ
以下の冒頭をサンプルとして同梱しています。
- 吾輩は猫である
- こころ
下記のようにインポートしてご利用ください。
import { gibun, samples } from 'gibun';
await gibun.train(samples.kokoro);
ライセンス
MIT