| Servicio de OCR |
|
|
El Reconocimiento Óptico de Caracteres (OCR) se ha convertido ya en un complemento indispensable en cualquier proceso de digitalización. Cada vez son menos frecuentes las páginas digitalizadas en las que no se ha realizado este proceso. Sin embargo, dadas las características de los materiales patrimoniales sobre los que están implementados la mayoría de los proyectos de digitalización que lleva a cabo DIGIBÍS, no es fácil ni mucho menos lograr la calidad indispensable. En busca de ella, DIGIBÍS utiliza la tecnología más avanzada disponible en el mercado y, en los últimos años, ha realizado un considerable número de desarrollos para validar la calidad de los textos reconocidos. Por otra parte, y siguiendo las tendencias internacionales, DIGIBÍS utiliza preferentemente como formato de reconocimiento de textos el Analyzed Layout and Text Object (ALTO) XML Schema, que desarrollado inicialmente para proyectos fundamentales tanto en Europa como en Estados Unidos, se ha convertido en un estándar de facto. De hecho, la Biblioteca del Congreso ha tomado la responsabilidad de mantener como uno de sus estándares este formato que presenta, además, la muy importante ventaja de que puede transmitirse como una extensión de METS, lo cual asegura la interoperabilidad de la información. DIGIBÍS ha desarrollado un programa específico para incluir, siguiendo la normativa de la Biblioteca del Congreso, los registros en ALTO atendiendo a las especificaciones de esa extensión. |
| Última actualización el Miércoles, 03 de Agosto de 2011 09:25 |
Si nos quiere preguntar algo o desea que le enviemos un presupuesto, póngase en contacto con nosotros. Le contestaremos a la mayor brevedad posible.
Si prefiere hacerlo por teléfono, marque el 915 81 20 01.
En el pie de las páginas de este sitio web tiene nuestra dirección completa por si le es de utilidad.