Tarde o temprano, la mayoría de las empresas necesitan implementar un sistema de flujo de documentos digitales. Al mismo tiempo, una de las cuestiones más importantes es la elección de un formato en el cual se suministrarán, almacenarán y enviarán los documentos a otras empresas o subdivisiones de la misma compañía. Hoy compararemos dos de estos formatos: PDF y DjVu.
Una breve introducción a DjVu
La historia de DjVu empezó en 1996. En ese entonces, una de las subdivisiones de AT&T empezó a trabajar en la creación de un nuevo formato. La principal tarea que se encomendó a los desarrolladores era crear una tecnología de almacenamiento y envío de documentos digitalizados, es decir, que todos los documentos estuviesen en formato electrónico. En ese momento, pocas personas podían imaginar que, en el futuro, las empresas intercambiarían acuerdos y contratos a través de la red global. Por lo tanto, se entendía que los documentos incluían revistas, periódicos, libros y documentación técnica digitalizada. En 1998 aparecieron los primeros complementos para la visualización de documentos DjVu con la ayuda de los exploradores.
En 1999 se publicó una nueva versión del formato DjVu. Se implementó la característica de unir varias imágenes en un archivo con la posibilidad de desplazarse por las páginas, así como la capacidad de agregar los denominados “hot spots”, que funcionaban como hipervínculos. El año siguiente apareció la tercera versión del formato DjVu. Al mismo tiempo, la compañía AT&T vendió su desarrollo a la firma LizardTech, que empezó a usarlo en sus propios productos comerciales. A la vez, el formato en sí mismo permanecía como un formato libre gratuito. Como resultado, existen ahora muchos productos gratuitos de software para trabajar con el formato DjVu.
En sí mismo,
el formato DjVu es una solución muy interesante y se presenta como una tecnología de compresión de imágenes con pérdida. Básicamente, divide un documento en tres capas: fondo, primer plano y una máscara en blanco y negro. Cada una de estas capas se procesa de forma independiente. Además, se usa una amplia variedad de tecnologías: un algoritmo para separar el texto del fondo en una imagen digitalizada; IW44, un algoritmo de compresión basado en transformación de ondas; JB2, un algoritmo para la compresión de imágenes en blanco y negro; ZP, un algoritmo de compresión universal; y un algoritmo para la descompresión a solicitud. Este método permite un máximo grado de compresión con un mínimo de distorsión. Una página digitalizada de un libro en formato DjVu tiene un tamaño de sólo 10-25 kilobytes.
Una breve introducción a PDF
La primera vez que se escuchó sobre PDF (Portable Document Format) fue en 1991. Fue entonces cuando la compañía Adobe Systems lo anunció como una nueva tecnología para la presentación de cualquier producto imprimible en formato electrónico. El nuevo formato logró un enorme éxito. De hecho, al años siguiente, el formato PDF recibió un premio en la prestigiosa feria internacional Comdex Fall. Adobe Systems prestó una gran atención al desarrollo de este producto. En 1994 apareció el formato PDF versión 1.1, que admitía vínculos externos, color independiente del dispositivo, hilos de artículos, así como comentarios y algunas características relacionadas con la seguridad. La siguiente versión de este formato apareció en 1996. Se implementó el soporte para las especificaciones de OPI 1.3 y el espacio de color CYMK.
El formato PDF 1.3 se lanzó en 1999. Difería de la versión anterior en la compatibilidad con fuentes CID de 2 bytes, las especificaciones OPI 2.0 y la presencia de tecnología que permitía sombras y degradados suaves. La siguiente versión del formato se publicó en 2001. Incluía importantes características como, por ejemplo, soporte para transparencias, cifrado de 128 bits y la opción de configurar la calidad de la impresión. Finalmente, la versión actual es el formato PDF 1.7, que apareció en 2006.
El principal factor diferenciados del formato PDF es su amplia distribución. Actualmente, muchos manuales, publicaciones periódicas, documentación técnica y otros tipos de documentos se presentan en este formato. Es más, en la práctica totalidad de los equipos se incluye software para la visualización del formato PDF.
Formatos DjVu y PDF: usos diversos
Si piensa usar los formatos DjVu y PDF para la organización de un sistema digital de flujo documental, vale la pena prestar atención a las particularidades de cada formato. La principal ventaja del formato DjVu es su pequeño tamaño. Esto es especialmente bueno para el trabajo con documentos que contienen muchos elementos no descifrables: imágenes, planos y fórmulas. Además, DjVu trabaja perfectamente en situaciones en que es necesario enviar no sólo el texto, sino también sus configuraciones: colores y tramas del original, así como los defectos y trazos que dejan otros objetos. De esta forma, DjVu resulta óptimo para el almacenamiento de documentación técnica como, por ejemplo, instrucciones y manuales, así como documentos históricos o simplemente raros. Actualmente, en la red global, existe una amplia biblioteca almacenada en este formato de casi cualquier tipo de literatura.
Sin embargo, hay que tener en cuenta que siempre que hablamos de archivos en formato DjVu, aludimos a documentos digitalizados que ya existen en papel u otros soportes. Esto no es tan simple. El formato se creó originalmente para el almacenamiento de copias digitalizadas de documentos. Y ahora prácticamente no hay herramientas (ni tampoco necesidad de ellas) para crear archivos DjVu de otro modo.
Hay muchas desventajas en el uso del formato DjVu para los sistemas de flujo de documentos digitales. Por un lado, comprime los datos con pérdida. Esto no es algo muy positivo cuando se trata de contratos, actas y otros documentos legales. En segundo lugar, considerando el hecho de que DjVu no tiene una amplia divulgación, no permite que las empresas lo utilicen libremente para intercambiar información con socios y clientes. En la mayoría de equipos de empresas y equipos domésticos, simplemente no se incluye el software para ver estos documentos electrónicos. En tercer lugar, este formato carece completamente de medidas de seguridad y confidencialidad para los documentos.
PDF resulta más adecuado para organizar sistemas de flujo de documentos digitales. El punto más importante es que PDF tiene una amplia distribución. Como hemos mencionado, la práctica totalidad de equipos personales, independientemente del sistema operativo que ejecuten, tiene software instalado no sólo para leer documentos PDF, sino también para “materializarlos” en cualquier dispositivo de impresión. Además, se obtienen copias exactas de los originales. De esta forma, se elimina el problema de compatibilidad: uno de los problemas más serios en el proceso de organizar un sistema de flujo de documentos digitales.
La segunda ventaja del formato PDF es que integra medidas de protección contra el acceso no autorizado. Con su ayuda, el usuario puede proteger un documento de ser visto o usado por otras personas. La tecnología criptográfica se usa como un medio de protección, y ha sido probado muchas veces por desarrolladores de software y expertos en seguridad de la información.
Finalmente, la tercera ventaja de PDF es que está estandarizado por ISO (International Organization for Standardization). En este momento, este formato ya tiene el estatus de estándar para el almacenamiento de documentos de archivo y para el intercambio de información en formato electrónico entre empresas. Y esto es sólo el principio. Los desarrolladores de este formato tienen previsto proporcionar sus especificaciones a la organización pública The Association for Information and Image Management. En este caso, es altamente probable que PDF se convierta en el estándar internacional para los sistemas de flujo de documentos digitales.
¿Qué conclusiones se pueden extraer de todo lo anterior?
Parece que los formatos DjVu y PDF no pueden considerarse rivales. Están diseñados para resolver tareas diferentes y, por lo tanto, no compiten, sino que se complementan. Por supuesto, como base para un sistema de flujo de documentos digitales, es mejor elegir el formato PDF, ya que se ha convertido de facto en el estándar a nivel mundial. Hay que mencionar que en algunas empresas ya existen archivos digitales DjVu de documentación técnica, creados mediante la digitalización de documentos de papel. No obstante, esto no es un motivo para elegir un formato en particular. Es mejor construir un sistema de flujo de documentos digitales moderno y funcional, y simplemente convertir los archivos DjVu al formato PDF.
Cómo convertir documentos de DjVu a PDF
Para implementar un sistema de flujo de documentos digitales, se usa el software habitual de trabajo con los archivos, incluido el que se distribuye de forma gratuita. Sin embargo, hay una tarea que el software no puede hacer.
Hablamos de convertir los documentos del formato DjVu a PDF. Para resolver esta tarea, se debe usar software adicional como, por ejemplo, Universal Document Converter. Este es un producto universal para la conversión de documentos en diversos formatos y funciona perfectamente en nuestro caso.
El principio subyacente del programa Universal Document Converter es que trabaja como una impresora virtual. Durante el proceso de instalación, crea en el sistema operativo un dispositivo de impresión adicional accesible desde cualquier programa. Al imprimir en esta impresora, el usuario recibe el archivo en el formato requerido. En la práctica, este método es muy cómodo. Primero, permite que el proceso de conversión se lleve a cabo rápidamente, casi sin preparación. En segundo lugar, es tan sencillo que no requiere ningún tipo de aprendizaje por parte de los usuarios finales.
El algoritmo para la conversión de un archivo desde el formato DjVu a un documento PDF con la ayuda de Universal Document Converter es el siguiente. Primero, el usuario debe abrir el archivo DjVu que necesita. Esto puede hacerse utilizando Internet Explorer con un complemento previamente instalado. Después, el usuario sólo debe presionar el botón “Imprimir” y elegir Universal Document Converter como dispositivo de impresión.
Marat Davletkhanov
A solicitud de fCoder Group, Inc.