0.1.4 • Published 22h ago

bgustreadimg

Licence

MIT

Version

0.1.4

Deps

Size

33 kB

Vulns

Weekly

Summary Dependency Versions

bgustreadimg

Motor de Preprocesamiento de Imágenes Adaptativo de Alto Rendimiento para Pipelines de OCR.
Elimina sombras, arrugas y variaciones de luz no uniformes en milisegundos — 100% Rust nativo.

bgustreadimg es un motor de preprocesamiento de imágenes de nivel industrial construido desde cero en Rust. Está diseñado para eliminar el ruido visual en fotografías de documentos —facturas, contratos, capturas de cámara— antes de ser enviadas a motores de OCR. A diferencia de los convertidores de formato convencionales, su núcleo implementa Binarización Adaptativa de Sauvola con Imágenes Integrales (SAT) para lograr una limpieza uniforme en tiempo lineal O(N), independientemente del tamaño de la ventana de análisis local.

Características Clave

Binarización Adaptativa Sauvola O(N): Umbral de contraste local dinámico usando Summed Area Tables. Elimina sombras, arrugas y fondos no uniformes sin distorsionar los caracteres.
Redimensionamiento Inteligente con Lanczos3: Escalado de alta calidad que conserva la nitidez del texto. Selección automática del ancho objetivo basada en la memoria RAM disponible.
Detección de Layout Opcional (ONNX): Módulo LayoutAnalyzer basado en Table Transformer para extraer regiones tabulares de documentos escaneados.
Inferencia OCR Opcional (ONNX): Módulo OcrEngine basado en Surya OCR para reconocimiento de texto multilingüe end-to-end.
Bindings NAPI-RS Nativos: Extensión dinámica .node cargada directamente por Node.js sin sobrecoste de IPC ni dependencias Python.
Doble Canal de Distribución: Biblioteca estática (rlib) para Rust en crates.io y bindings dinámicos (cdylib) para npm.

Arquitectura del Pipeline

                    ┌─────────────────────┐
                    │   Input Image       │
                    │  (JPEG, PNG, ...)   │
                    └─────────┬───────────┘
                              │
                    ┌─────────▼───────────┐
                    │  Metadata Probe     │
                    │  (formato, dims)    │  ── sin decodificar a RAM
                    └─────────┬───────────┘
                              │
                    ┌─────────▼───────────┐
                    │  Decode & Resize    │
                    │  Lanczos3, auto-RAM │
                    └─────────┬───────────┘
                              │
                    ┌─────────▼───────────┐
                    │  Sauvola Adaptive   │
                    │  Binarization (SAT) │
                    │  O(N), window_size  │
                    └─────────┬───────────┘
                              │
                    ┌─────────▼───────────┐
                    │  Layout Detection   │  ── ONNX (table-transformer)
                    │  (opcional)         │
                    └─────────┬───────────┘
                              │
                    ┌─────────▼───────────┐
                    │  OCR Inference      │  ── ONNX (surya-ocr)
                    │  (opcional)         │
                    └─────────┬───────────┘
                              │
                    ┌─────────▼───────────┐
                    │  Clean Output PNG   │
                    │  (sin pérdidas)     │
                    └─────────────────────┘

Canales de Distribución

1. Canal Rust (Crates.io)

Versión Activa: v0.1.4
Tipo: Biblioteca estática (rlib).
Uso:
```
[dependencies]
bgustreadimg = "0.1.4"
```

2. Canal Node.js & NPM

Versión Activa: v0.1.4
Tipo: Extensión nativa (cdylib mediante NAPI-RS).
Instalación:
```
npm install bgustreadimg
```

Instalación y Compilación de Desarrollo

Clonar el repositorio:

git clone https://github.com/B-GUST/bgustreadimg.git
cd bgustreadimg

Compilar la librería Rust:
```
cargo build --release
```
Compilar bindings de Node.js (opcional):
```
npm install
npm run build
```

Primeros Pasos

Rust

use bgustreadimg::preprocess_image_rs;

let image_data = std::fs::read("input.jpg").unwrap();
let result = preprocess_image_rs(image_data, Some(
    bgustreadimg::PreprocessConfigRs {
        window_size: Some(25),
        k: Some(0.2),
        target_width: Some(1920),
    }
)).await.unwrap();

std::fs::write("output.png", result).unwrap();

Node.js

const { preprocessImage } = require('bgustreadimg');
const fs = require('fs');

const clean = await preprocessImage(fs.readFileSync('input.jpg'), {
    windowSize: 25,
    k: 0.2,
    targetWidth: 1920,
});
fs.writeFileSync('output.png', clean);

Configuración

Parámetro	Default	Descripción
`windowSize`	`25`	Tamaño de la ventana local de análisis (impar, ≥3)
`k`	`0.2`	Sensibilidad al contraste (menor = más agresivo con sombras)
`targetWidth`	auto	Ancho máximo de salida; auto-selecciona 1920 o 1280 según RAM libre

Estructura del Proyecto

├── Cargo.toml          # Manifiesto Rust (publicable en crates.io)
├── build.rs            # Script de compilación NAPI-RS
├── src/
│   ├── lib.rs          # Núcleo: Sauvola threshold, preprocess_image, bindings NAPI
│   ├── layout.rs       # LayoutAnalyzer — detección de tablas con ONNX
│   └── ocr.rs          # OcrEngine — reconocimiento de texto con ONNX
├── index.js            # Binding NAPI-RS para Node.js (auto-generado)
├── index.d.ts          # Declaraciones de tipos TypeScript
├── models/             # Modelos ONNX (gitignored, descarga bajo demanda)
│   ├── sury-ocr/
│   └── table-transformer/
├── package.json        # Manifiesto npm
├── CONTRIBUTING.md     # Guía de contribución
├── CREDITS.md          # Créditos y atribuciones
└── LICENSE             # Licencia MIT

Licencia y Créditos

Este proyecto se distribuye bajo la licencia MIT. Consulta el archivo CREDITS.md para atribuciones al algoritmo de Sauvola y las librerías de terceros.

Keywords

ocr image-processing sauvola binarization preprocessing rust