1.0.0 • Published 6 years ago

randchinese v1.0.0

Weekly downloads
6
License
LGPL-3.0
Repository
github
Last release
6 years ago

中文亂文隨機生成器

為什麼需要這個亂文生成器?

現在比較好的亂文生成器主要都是直接在網上生成,只可以人手複製到要用的地方。如果只是用來設計時試排版是沒問題的,但是有如果需要大量生成就不太方便。(例如做 unit test 的時候想要中文輸入)

另一個常見的做法就是在 UTF8 中指定漢字一段,再隨機在其中抽出文字。這樣生出來的字大概是這樣的:

悍箳寊貈绺鶭缂迩泜輅歍銋囄轴埄侭鐸攛塰俟兯锁沟忍鳚苚鉤

雖然生出來的是方塊字,但太陌生的字看起來還是不像是中文。(事實上也真的可能不是中文,因為那段叫 CJK - Chinese, Japanese, Korean,即中文正體字、簡體字、日本漢字和韓國用的漢字都包含在內。因為有些字的確是幾種語言共用的,所以這不能怪 UTF8。)

這個生成器使用香港課程發展處中國語文教育組的《中英文對照香港學校中文學習基礎字詞》中記載的正體字,只收錄大概 4000 多個在香港中小學會接觸到的正體字。生出來的字大概是這樣的:

攻格瑣雇嬪腐楓蹉臭舖黏沖賒廬侮彭疼呃淅龐

好吧,雖然總算是一些讀得出來的字了,但看起來還是有點太複雜。所以我還增加了一個複雜程度的選項。我把 4000 多個字按筆劃多少排序,由少筆劃到多筆劃,然後從中抽取頭 500 個(這個數字可以選擇)。生出來的字大概是這樣:

朽乏斤允叉企十妃划巧毛任只舌吁冬低乙友弘

如何使用這個生成器?

使用 npm:

npm install randchinese

然後:

var randChinese = require('./index.js');

console.log(randChinese());//沒有數字的話預設生成 20 個中文字
console.log(randChinese(5));//你也可以輸入想要的長度
console.log(randChinese(30, 4000)); //後面的數字決定複雜程度,可以是任何小於 4000 的數字