Archivo de la categoría: Ofimática

OCR usando Google Drive

En el anterior artículo hablábamos de una aplicación para GNU/Linux que realiza OCR sobre imágenes.

Existen muchas webs que realizan este tipo de procesado (tenemos que subir la imagen y nos devuelven un archivo de texto). Normalmente tienen limitaciones de texto, de peso de imagen, de número de páginas, de formatos de salida aceptados, de tiempo…

Otra opción -que es la que os quería comentar en este pequeño post-, es usar Google Drive.

Para esto último tenemos que activar, dentro de Google Drive, las dos opciones que véis en la siguiente imagen (*):

Opción OCR Google Drive

Una vez hecho esto, cada vez que subamos un archivo de imagen o pdf nos preguntará si queremos convertirlo a texto.

Una vez hecho, cuando abramos el archivo aparecerá la imagen y a continuación todo el texto.

Hay una limitación de 10 hojas si se trata de un pdf. Para mejores resultados, y al igual que dijimos en el anterior artículo, tened en cuenta:

  • Mejor cuando mayor contraste (blanco y negro mejor que escala de grises)
  • Mejor cuanta más calidad tenga la imagen (sin pasarnos de peso en la imaegn, eso sí, que creo que es de 2 MB)
  • Mejor si el formato es sencillo (negrita, cursiva, tamaño de letra). Si incluye tablas, múltiples columnas, etc., el resultado no será muy fiable.

 

(*) Si le habéis dado a «probar la nueva versión de Google Drive» esta opción no aparece y tendréis que volver a esta versión para poder usarla (es posible que esté ya en la nueva versión pero yo no la ví en su momento).

OCR usando GNU/Linux

En la actual «era digital», todo resulta mucho más sencillo -la mayoría de las veces-, trabajando con los archivos en formato electrónico en lugar de en papel.

Además, para archivarlos es mucho más cómodo, no ocupan espacio físico en el despacho y además es todo más versátil (por ejemplo, puedes hacer búsquedas rápidamente en grandes cantidades de ficheros).

Dicho esto, está claro que además de tener archivos en formato electrónico, también nos encontramos con archivos en formato impreso (en papel, vaya). Estos últimos podemos escanearlos para guardarlos en el ordenador.

La «pega» es que si necesitamos editarlos esto no es posible porque, una vez escaneados, son una imagen -no son texto-. En cualquier caso, a estas alturas esto es algo que se soluciona fácilmente, existiendo aplicaciones que además de escanear realizan un reconocimiento óptico de caracteres (lo que se conoce como «OCR», por sus siglas en inglés: Optic Character Recognition).

Estas aplicaciones analizan la imagen en cuestión en busca de patrones que puedan parecerse a las letras de un idioma y signos de puntuación.

Si el documento tiene imágenes entre el texto y/o el formato no es sencillo (tiene tablas, columnas, etc.), el OCR no será todo lo preciso que podría, pero para la mayoría de documentos, cartas, informes, etc., nos hará un buen trabajo (quitándonos muchas horas de pasarlo de nuevo a ordenador tecleándolo entero).

Interesa que la imagen escaneada esté en una calidad aceptable. Cuando mayor contraste mejor (es decir, mejor escanear en blanco y negro que en escala de grises o color normalmente).

Lo que nos interesa a nosotros es, por tanto, encontrar un software que realice ocr en nuestro sistema operativo (GNU/Linux, claro). Yo os recomiendo la aplicación tesseract, la cuál fue desarrollada en su momento por HP y ahora es continuada por Google. Existe para la mayoría de las distros y es gratuita bajo la licencia Apache 2.0. Si vuestra distro no la trae en los repositorios oficiales (no será una distro muy conocida entonces), Podéis descargarla aquí:

Usar la aplicación es sencillo:

tesseract IMAGEN.png SALIDA -l spa

donde:

  • IMAGEN.png es nuestra imagen escaneada (acepta varios formatos, entre ellos png)
  • SALIDA es el fichero de salida que se genera con el texto
  • con -l spa indicamos que el texto está en español (admite muchos más idiomas (*))

(*) Para ver qué idiomas tenemos instalados escribimos: tesseract –list-langs.

 

Crear vídeo con fotos y audio en Linux

Cuando uno tiene unas fotos de un viaje, de un evento o de cualquier tema y quiere mostrarlas a sus amigos y familiares, antes era habitual crear una presentación con las fotos (con un programa tipo PowerPoint o Libreoffice Impress).

Sin embargo, y ante la necesidad de usar medios audiovisuales como reproductor de vídeo/televisión para mostrar las colecciones personales de fotos de experiencias, poco a poco fue surgiendo una serie de programas que permitían, en lugar de crear una presentación (que necesita de un PC para mostrarla), un vídeo con formato estándar que se podía ya reproducir en un reproductor doméstico.

Si venís del mundo Windows (o seguís aún en él) conoceréis aplicaciones para tal fin como MemoriesOnTV. Este tipo de aplicaciones, permiten colocar las fotos en una secuencia, aplicar efectos y transiciones, insertar audio y finalmente crear un vídeo con dichas fotos y canciones de fondo.

En Linux tenemos varias aplicaciones para realizar esta función, aunque una muy sencilla pero también muy potente, es openshot.

Dado que en el blog desdelinux ya han explicado muy bien cómo usar dicho programa para este cometido, simplemente os dejo el enlace aquí para que lo sigáis y lo probéis.

Como véis, en Linux tenemos aplicaciones para hacer las mismas cosas que en Windows, de forma similar, con mayor funcionalidad y sencillez normalmente y, desde luego, a coste cero.

Presentaciones web a partir de fichero de texto plano

Introducción

Cuando uno va  crear una presentación siempre recurre a programas tipo Powerpoint o -mejor aún- Libreoffice Impress. Estos programas generan un archivo que luego se puede reproducir a pantalla completa en un PC. Dicho PC debe contar con el programa en cuestión para visualizar la presentación o, al menos, de un visor compatible con dicho formato.

Otra posibilidad es genera una presentación para ser visualizada en un navegador web. Algunos programas permiten generar presentaciones de este modo pero, si queremos modificar la presentación, tenemos que tener, igualmente, el programa en cuestión para poder hacer los cambios que queramos para después volver a exportar la presentación en formato html.

A mí me gusta no tener que depender de programas concretos para editar las presentaciones, y tenía pendiente buscar algún mecanismo sencillo para generar presentaciones simples sin tener que estar toqueteando formatos cada 2×3.

Un día, en una presentación Caldum descubrí precisamente lo que andaba buscando: el sistema Slideshow S9.

Slideshow S9 es una solución solución elegante y sencilla para generar las presentaciones a partir de un archivo de texto plano «formateado» (*) usando Markdown.

Markdown

Markdown es un lenguajes de marcas ligero, es decir, un lenguaje más sencillo que otros como html, por ejemplo, que a la hora de editar se hacen más complejos y difíciles de mantener. Para entenderlo más fácilmente, lo mejor es un ejemplo:

Para poner en cursiva algo simplemente lo pondríamos así:

 

*texto a poner en cursiva*

Si queremos poner en negrita algo lo haríamos así:

**texto a poner en negrita**

Si queremos poner una lista no ordenada (la típica de guiones), la pondríamos así:

* Un elemento 
* Otro elemento de la lista

Si queremos hacer una lista ordenada:

1. Elemento 1
2. Elemento 2

Con esto ya os hacéis una idea de lo sencillo que es crear un archivo en Markdown. Si queréis ampliar la información al respecto, os dejo unos enlaces interesantes:

Slideshow S9

¿Pero qué es realmente Slideshow S9? Es un sistema para generar presentaciones html (para visualizarlas en un navegador web) a partir de un archivo de texto en formato markdown (entre otros).

En la web oficial tenéis, además de toda la información sobre el proyecto, un ejemplo de presentación en texto plano que os recomiendo que probéis para ver lo fácil y cómodo que es crear presentaciones usándolo.

Lo primero que necesitáis si queréis usarlo es instalarlo en vuestro sistema. Slideshow S9 está escrito en Ruby que se puede instalar usando el sistema de gestión de paquetes de Ruby llamado RubyGems. Para ello usaremos -como root- la aplicación gem, que es como se llama el programa que permite usar RubyGems en Linux:

# gem install slideshow

Una vez instalado, para crear una presentación a partir de un fichero de texto plano (podéis usar, insisto, el ejemplo que viene en la web oficial), haríamos esto:

$ slideshow2.0 build presentacion.txt

Ahora abrimos el fichero «presentacion.html» en el navegador y podremos ver la misma. Para poder avanzar y retroceder podemos usar distintas teclas, entre otras:

Action Key
Siguiente transparencia Space Bar, Right Arrow Down Arrow, Page Down
Anterior transparencia Left Arrow, Up Arrow, Page Up
Primera transparencia Home
Última End

Plantillas

El aspecto de la presentación es demasiado simple, pero podemos cambiar su aspecto sin más que usando alguna de las plantillas que hay disponbiles. Ésta es una de las cosas más interesantes que tiene este sistema, que se pueden usar montones de plantillas de forma muy sencilla, cambiando así el aspecto global de la presentación.

Las plantillas tenemos que instalarlas primero, pero su instalación no podría ser más sencilla. Primero ejecutamos este comando para actualizar el sistema de paquetes de RubyGems y que tenga en cuenta todos los últimos cambios en el mismo:

$ slideshow2.0 update

A continuación ejecutamos esto para instalar la plantilla:

$ slideshow2.0 install PLANTILLA
 
 Plantillas buenas: impress.js, deck.js, shower... Ejemplo de instalación de la plantilla "shower":
$ slideshow2.0 install shower

Ahora, si queremos generar una presentación usando una plantilla haríamos esto (en este caso usaremos la plantilla «shower»):

$ slideshow2.0 build presentacion.txt -t shower

Con este comando podéis ver qué plantillas tenéis instaladas:

$slideshow2.0 list

Podéis encontrar más plantillas aquí y más info sobre las mismas aquí.

Conclusiones

  • Si necesitáis hacer una presentación que se pueda visualizar sin problemas en cualquier equipo sin depender de que tenga tal o cual software,
  • si os gusta trabajar en texto plano para poder editarlo fácilmente,
  • si no queréis perder mucho tiempo en los formatos de las presentaciones y
  • si queréis automatizar al máximo la creación de presentaciones sencillas…

… ¡no dejéis de probar Slideshow S9!

 

(*) Lo entrecomillo porque realmente el formateo lo aplicamos a la vez que vamos escribiendo (una vez que conocemos el lenguaje Markdown y tenemos una cierta experiencia en su uso).