El OCR, o reconocimiento óptico de caracteres, es una de esas tecnologías veteranas que nunca parecen funcionar del todo bien. Consiste en reconocer los caracteres escritos o impresos y digitalizarlos; en otras palabras, pasar lo que hay en el papel a la pantalla, no como una imagen, sino como texto que podamos seleccionar y editar.
No es tan sencillo como suena. El programa tiene que ser capaz de reconocer infinidad de tipos de letras diferentes, pero incluso así puede fallar; por ejemplo, puede que la fotografía o el escaneo del documento incluya imperfecciones o no tenga mucha resolución. Y si el documento tiene un formato especial, como tablas o gráficos, entonces es básicamente imposible que el programa te lo detecte correctamente.
La IA que extrae texto de documentos puede ser el salto que necesitaba el OCR
Hasta ahora, dice Amazon, que ha presentado Textract, un nuevo servicio OCR para AWS (Amazon Web Services) capaz de reconocer y extraer texto de cualquier fuente. La compañía se ha demostrado especialmente confiada con este producto, llegando a afirmar que es capaz de procesar millones de páginas en sólo unas horas, y todo de manera precisa.
Textcract está basado en el aprendizaje automático, gracias a lo que ha podido aprender detalles que normalmente se escapan a los programas tradicionales, como el contexto; es capaz de detectar el tipo de documento que está escaneando, y buscar caracteres y palabras dependiendo de esto.
Por ejemplo, esta IA es capaz de reconocer extractos bancarios, facturas, tickets, cartas del banco y de Hacienda …