Tener tu dossier de prensa a primera hora de la mañana y con todas las noticias que te interesan es prioritario si te dedicas a la Comunicación. Pero ¿conoces el proceso para obtener las noticias?¿Tienes todas las menciones de tu marca?
Las empresas de seguimiento de medios cuentan con un sistema de Reconocimiento Óptico de Caracteres (OCR).
Este sistema convierte los documentos impresos a digital. Y no solo eso. El OCR también analiza los documentos digitales para clasificarlos por palabras clave.
Así, todas las noticias, sean digitales o impresas, imágenes o textos, pasan por el OCR.
Cómo funciona el OCR
El proceso que sigue el algoritmo de OCR se divide en cuatro etapas. Hay que entender cómo funciona en cada una de las partes para saber por qué comete fallos.
Primero, binariza la imagen, es decir, convierte la imagen en blanco y negro. Esto sirve para aislar la parte de la imagen que tiene texto.
El segundo paso es la segmentación de la imagen. Aquí, el algoritmo descompone el texto aislado de la imagen en diferentes partes mediante la clusterización.
La tercera etapa es el adelgazamiento de los componentes. En esta parte se limpian los caracteres para hacer posible su clasificación y reconocimiento.
Por último, el algoritmo hace una comparación con patrones. Las partes descompuestas del texto escaneado se comparan con patrones que están almacenados en una base de datos.
OCR en el seguimiento de medios
El reconocimiento óptico tiene dos utilidades para el seguimiento de medios.
Primero, es la herramienta que consigue que se puedan incluir aquellas noticias impresas dentro de la base de datos.
La segunda utilidad es la de buscar y filtrar las que son relevantes para nuestra compañía. Esta tecnología permite extraer las informaciones de todo el Big Data y clasificarlas según sus palabras clave (estas pueden ser pautas, temas, nombres…)
Por lo que hace el seguimiento de medios mucho más rápido y eficiente. Así puedes tener recogidas todas las menciones de tu marca en un corto periodo de tiempo.
Sin embargo, como cualquier tecnología, el OCR tiene sus inconvenientes. Si nos basamos solo en este sistema para hacer el seguimiento de medios, los clientes recibirán mucho ruido en su dossier diario.
Inconvenientes de no revisar las noticias
Todas las empresas utilizan este sistema para hacer el seguimiento de medios. El problema ocurre cuando, en vez de utilizarlo como primer filtro, envían automáticamente la información a los clientes.
Esto ocasiona que los dossieres estén llenos de noticias que no tienen nada que ver con su compañía. El no hacer una revisión manual después de que el algoritmo haya clasificado y elegido las noticias aumenta el ruido del dossier.
El OCR puede fallar a la hora de reconocer un documento. Por ejemplo, si el papel de la imagen que queremos pasar por OCR tiene mucho brillo (como el papel fotográfico que se utiliza para las revistas), el algoritmo puede no reconocer los caracteres.
Por eso, es necesario hacer una revisión manual de los documentos, una vez que estén clasificados y digitalizados. Ya que si las menciones de tu marca aparecen mezcladas con noticias sin ningún interés para tu compañía, tardarás tiempo en encontrarlas y recogerlas.
Combinar la revisión manual con el OCR para eliminar el ruido
Pese a que la tecnología avanza a pasos agigantados, todavía no es posible tener un OCR que funcione perfectamente. Es por eso, que la mejor solución para el seguimiento de medios es combinar el reconocimiento óptico con la revisión manual.
La revisión manual es el proceso por el que un documentalista lee cada documento para conseguir clasificarlo o desecharlo, según su interés para la compañía.
El inconveniente de la revisión manual es que es un proceso lento, por lo que si no contáramos con un OCR que hiciera una previa clasificación, cada documentalista tendría que leerse una media de 400 medios de comunicación en una mañana.
Así, el OCR consigue agilizar el trabajo del documentalista y el documentalista subsanará los errores y el ruido que puede causar el algoritmo.
Cómo saber si mi dossier está revisado
Si recibes mucho ruido cada día en tu dossier de prensa, seguramente sea porque se envíe automáticamente sin pasar por revisión manual.
La utilidad que se le da al OCR en las empresas de clipping es diferente. En algunas sirve solo como buscador, mientras que en otras es el único filtro por el que pasan todas las informaciones antes de llegar al cliente.
Si quieres el mejor seguimiento de medios, tendrás que buscar una empresa que combine ambos procesos. Así, te garantizas de tener la información a primera hora de la mañana y con todas las noticias verdaderamente relevantes para ti.
Si quieres empezar a recibir las noticias de tu marca revisadas, descubre nuestro servicio de seguimiento de medios