Dropbox empieza a activar el reconocimiento de caracteres (OCR) automático a fotos y documentos

Escrito por Rubén Velasco

Cada vez utilizamos más la nube, tanto a nivel personal como nivel profesional, en nuestro día a día. Las principales nubes, como Google Drive, OneDrive o Dropbox, en muy poco tiempo se han convertido en mucho más que simples plataformas de almacenamiento implementando todo tipo de funciones y herramientas para que trabajar con ellas nos sea lo más cómodo posible y no necesitemos, por ejemplo, depender de otras herramientas de terceros para realizar determinadas tareas. Hoy, Dropbox ha ido un paso más adelante y ha empezado a incluir en su nube una nueva herramienta que permitirá realizar reconocimiento OCR automático.

El Reconocimiento Óptico de Caracteres, también llamado OCR, es una técnica mediante la cual se analiza cualquier foto, imagen e incluso documentos con el fin de poder reconocer fácilmente todos los caracteres que se encuentren para poder tratarlos como si fueran texto, es decir, buscarlos, copiarlos, etc. El OCR no es una técnica precisamente sencilla y, aunque hay muchas aplicaciones que permiten hacerlo (algunas hasta de código abierto), los resultados que nos ofrecen no suelen ser precisamente perfectos, siendo muy pocas las aplicaciones que realmente funcionan correctamente.

Dropbox afirma que entre el 10% y el 20% de los archivos que sus usuarios suben a la nube son fotos de documentos, el tipo de archivo estándar para hacer OCR, reconocer su texto y permitir a los usuarios buscarlo fácilmente o copiarlo. Por ello, la plataforma líder en almacenamiento en la nube ha anunciado que está empezando a implementar esta nueva función en sus servidores.

El OCR de Dropbox solo estará en inglés y para los usuarios de pago, de momento

Los responsables de Dropbox han anunciado que, desde ya mismo, han empezado a implementar este reconocimiento óptico de caracteres automático. De momento, esta nueva función se irá desplegando poco a poco, por lo que hasta que llegue a todos los usuarios seguramente tarde aún varias semanas, aunque los usuarios que realmente necesiten la función pueden solicitar un acceso anticipado a ella.

Este nuevo sistema de reconocimiento OCR automático analizará los archivos JPEG, GIF (estáticos), PNG, TIFF y PDF. Además, también analizará todos los que ya tengamos subidos a nuestra cuenta de Dropbox de manera automática, no solo los que subamos a partir de ahora.

De momento solo reconocerá texto en inglés, y solo estará disponible en los planes Professional, Business y Enterprise, aunque se espera que en un futuro no muy lejano aumenten los idiomas, e incluso podría llegar a los usuarios del plan gratuito, aunque de esto no se sabe nada aún.

¿Qué pasa con la privacidad de los archivos de los usuarios

Dropbox es consciente de que esta característica puede ser un problema para la seguridad de muchos usuarios. Aunque la compañía no ha dado muchas pistas sobre cómo funciona esta característica, ha asegurado que se basa en el Machine Learning (para ir aprendiendo y seguir ofreciendo resultados cada vez más precisos) y, además, que la técnica de análisis utilizada es totalmente segura.

La compañía no ha hablado mucho sobre privacidad, aunque teniendo en cuenta que su público más frecuente es el sector profesional seguramente no se arriesgue a poner en riesgo los datos de sus usuarios.

¿Qué opinas sobre el nuevo reconocimiento OCR de Dropbox?

Fuente > techcrunch