Pasar al contenido principal

Reconocimiento de texto OCR/HTR (Handwritten Text Recognition)

dhSegment  segmentación/layout para documentos históricos. Documentación: Read the Docs

docTR  OCR con detección + reconocimiento, orientado a integración en proyectos. Documentación: mindee.github.io/doctr

eScriptorium  plataforma web de código abierto para gestionar flujos de trabajo de transcripción (importación, segmentación/layout, transcripción, corrección y entrenamiento de modelos), construida sobre Kraken. Documentación: Read the Docs

Kraken  motor OCR/HTR con análisis de layout. Documentación: kraken.re

LayoutParser  detección de layout (bloques/regiones) y utilidades para pipelines. Documentación: Read the Docs

PaddleOCR  OCR y “document parsing” (estructura, layout). Documentación: paddleocr.ai

Tesseract OCR  OCR open source especialmente sólido para texto impreso. Documentación: tessdoc

Transkribus  plataforma para reconocimiento de texto impreso (OCR) y manuscrito (HTR) en documentos históricos.