0.0.9 • Published 11 years ago

turbofil-correction v0.0.9

Weekly downloads
37
License
-
Repository
-
Last release
11 years ago

turbofilm-correction

Простой модуль коррекции названий сериалов по словарю.

Модуль задействует нативное апи v8, чтобы ускорить поиск подходящей коррекции.

Модуль экспериментальный, и написан в худших традициях говнокодинга, но свою задачу он выполняет довольно сносно: скорость поиска коррекции по словарю из 6000 строк выполняется за ~0,4мс, против нескольких секунд чистой javascript-реализации.

Установка

npm install turbofilm-correction

апи

var tfc = require ('turbofilm-correction');
tfc.add ('house m.d.'); // Добавляем наименование в словарь
tfc.query ('house'); // -> ["house m.d."]

Есть еще один момент.

Поскольку на начало написания еще не было понятно, как это все должно работать, есть две функции, которые используются следующим образом.

tfc.levenshtein ("abc", "abf"); // Расстояние левенштейна между двумя словами
tfc.dice ("def", "xef"); // Коэффициент дайса

Обе эти функции реализованиы на c++, поэтому выполняются достаточно быстро, но кроме этого, их (или любые другие функции с двумя строковыми аргументами) можно передавать в функцию query следующими за первым параметрами.

tfc.query ('porn', tfc.dice, tfc.levenshtein) // -> [["porno", 0.15, 3],[]...], где 0.15 – коэффициент дайсе, а 3 – расстояние левенштейна.

Тесто

См. test/README.md

0.0.9

11 years ago

0.0.8

11 years ago

0.0.7

11 years ago

0.0.6

11 years ago

0.0.4

11 years ago

0.0.3

11 years ago

0.0.2

11 years ago