npm.io
0.1.4 • Published 22h ago

bgustreadimg

Licence
MIT
Version
0.1.4
Deps
0
Size
33 kB
Vulns
0
Weekly
0

bgustreadimg

Motor de Preprocesamiento de Imágenes Adaptativo de Alto Rendimiento para Pipelines de OCR.
Elimina sombras, arrugas y variaciones de luz no uniformes en milisegundos — 100% Rust nativo.

Crates Version NPM Version Stable Version License


La Visión

bgustreadimg es un motor de preprocesamiento de imágenes de nivel industrial construido desde cero en Rust. Está diseñado para eliminar el ruido visual en fotografías de documentos —facturas, contratos, capturas de cámara— antes de ser enviadas a motores de OCR. A diferencia de los convertidores de formato convencionales, su núcleo implementa Binarización Adaptativa de Sauvola con Imágenes Integrales (SAT) para lograr una limpieza uniforme en tiempo lineal O(N), independientemente del tamaño de la ventana de análisis local.


Características Clave

  • Binarización Adaptativa Sauvola O(N): Umbral de contraste local dinámico usando Summed Area Tables. Elimina sombras, arrugas y fondos no uniformes sin distorsionar los caracteres.
  • Redimensionamiento Inteligente con Lanczos3: Escalado de alta calidad que conserva la nitidez del texto. Selección automática del ancho objetivo basada en la memoria RAM disponible.
  • Detección de Layout Opcional (ONNX): Módulo LayoutAnalyzer basado en Table Transformer para extraer regiones tabulares de documentos escaneados.
  • Inferencia OCR Opcional (ONNX): Módulo OcrEngine basado en Surya OCR para reconocimiento de texto multilingüe end-to-end.
  • Bindings NAPI-RS Nativos: Extensión dinámica .node cargada directamente por Node.js sin sobrecoste de IPC ni dependencias Python.
  • Doble Canal de Distribución: Biblioteca estática (rlib) para Rust en crates.io y bindings dinámicos (cdylib) para npm.

Arquitectura del Pipeline

                    ┌─────────────────────┐
                    │   Input Image       │
                    │  (JPEG, PNG, ...)   │
                    └─────────┬───────────┘
                              │
                    ┌─────────▼───────────┐
                    │  Metadata Probe     │
                    │  (formato, dims)    │  ── sin decodificar a RAM
                    └─────────┬───────────┘
                              │
                    ┌─────────▼───────────┐
                    │  Decode & Resize    │
                    │  Lanczos3, auto-RAM │
                    └─────────┬───────────┘
                              │
                    ┌─────────▼───────────┐
                    │  Sauvola Adaptive   │
                    │  Binarization (SAT) │
                    │  O(N), window_size  │
                    └─────────┬───────────┘
                              │
                    ┌─────────▼───────────┐
                    │  Layout Detection   │  ── ONNX (table-transformer)
                    │  (opcional)         │
                    └─────────┬───────────┘
                              │
                    ┌─────────▼───────────┐
                    │  OCR Inference      │  ── ONNX (surya-ocr)
                    │  (opcional)         │
                    └─────────┬───────────┘
                              │
                    ┌─────────▼───────────┐
                    │  Clean Output PNG   │
                    │  (sin pérdidas)     │
                    └─────────────────────┘

Canales de Distribución

1. Canal Rust (Crates.io)
  • Versión Activa: v0.1.4
  • Tipo: Biblioteca estática (rlib).
  • Uso:
    [dependencies]
    bgustreadimg = "0.1.4"
2. Canal Node.js & NPM
  • Versión Activa: v0.1.4
  • Tipo: Extensión nativa (cdylib mediante NAPI-RS).
  • Instalación:
    npm install bgustreadimg

Instalación y Compilación de Desarrollo

  1. Clonar el repositorio:

    git clone https://github.com/B-GUST/bgustreadimg.git
    cd bgustreadimg
  2. Compilar la librería Rust:

    cargo build --release
  3. Compilar bindings de Node.js (opcional):

    npm install
    npm run build

Primeros Pasos

Rust
use bgustreadimg::preprocess_image_rs;

let image_data = std::fs::read("input.jpg").unwrap();
let result = preprocess_image_rs(image_data, Some(
    bgustreadimg::PreprocessConfigRs {
        window_size: Some(25),
        k: Some(0.2),
        target_width: Some(1920),
    }
)).await.unwrap();

std::fs::write("output.png", result).unwrap();
Node.js
const { preprocessImage } = require('bgustreadimg');
const fs = require('fs');

const clean = await preprocessImage(fs.readFileSync('input.jpg'), {
    windowSize: 25,
    k: 0.2,
    targetWidth: 1920,
});
fs.writeFileSync('output.png', clean);

Configuración

Parámetro Default Descripción
windowSize 25 Tamaño de la ventana local de análisis (impar, ≥3)
k 0.2 Sensibilidad al contraste (menor = más agresivo con sombras)
targetWidth auto Ancho máximo de salida; auto-selecciona 1920 o 1280 según RAM libre

Estructura del Proyecto

├── Cargo.toml          # Manifiesto Rust (publicable en crates.io)
├── build.rs            # Script de compilación NAPI-RS
├── src/
│   ├── lib.rs          # Núcleo: Sauvola threshold, preprocess_image, bindings NAPI
│   ├── layout.rs       # LayoutAnalyzer — detección de tablas con ONNX
│   └── ocr.rs          # OcrEngine — reconocimiento de texto con ONNX
├── index.js            # Binding NAPI-RS para Node.js (auto-generado)
├── index.d.ts          # Declaraciones de tipos TypeScript
├── models/             # Modelos ONNX (gitignored, descarga bajo demanda)
│   ├── sury-ocr/
│   └── table-transformer/
├── package.json        # Manifiesto npm
├── CONTRIBUTING.md     # Guía de contribución
├── CREDITS.md          # Créditos y atribuciones
└── LICENSE             # Licencia MIT

Licencia y Créditos

Este proyecto se distribuye bajo la licencia MIT. Consulta el archivo CREDITS.md para atribuciones al algoritmo de Sauvola y las librerías de terceros.

Keywords