Has rechazado las cookies. Puedes reconsiderar esta decisión

You have allowed cookies to be placed on your computer. This decision can be reversed.

Servicio de OCR

El Reconocimiento Óptico de Caracteres (OCR) se ha convertido ya en un complemento indispensable en cualquier proceso de digitalización.

Cada vez son menos frecuentes las páginas digitalizadas en las que no se ha realizado este proceso. Sin embargo, dadas las características de los materiales patrimoniales sobre los que están implementados la mayoría de los proyectos de digitalización que lleva a cabo DIGIBÍS, no es fácil ni mucho menos lograr la calidad indispensable.

En busca de ella, DIGIBÍS utiliza la tecnología más avanzada disponible en el mercado y, en los últimos años, ha realizado un considerable número de desarrollos para validar la calidad de los textos reconocidos.

Por otra parte, y siguiendo las tendencias internacionales, DIGIBÍS utiliza preferentemente como formato de reconocimiento de textos el Analyzed Layout and Text Object (ALTO) XML Schema, que desarrollado inicialmente para proyectos fundamentales tanto en Europa como en Estados Unidos, se ha convertido en un estándar de facto.

De hecho, la Biblioteca del Congreso ha tomado la responsabilidad de mantener como uno de sus estándares este formato que presenta, además, la muy importante ventaja de que puede transmitirse como una extensión de METS, lo cual asegura la interoperabilidad de la información.

DIGIBÍS ha desarrollado un programa específico para incluir, siguiendo la normativa de la Biblioteca del Congreso, los registros en ALTO atendiendo a las especificaciones de esa extensión.