¿Cuál es el software de OCR más potente y preciso para el texto japonés?

Mi experiencia es que no hay ningún paquete de software de OCR que supere sistemáticamente a todos los demás en el texto japonés. El rendimiento puede variar mucho en función de diversos factores, como la calidad de la imagen, la resolución de escaneado, las fuentes utilizadas, el diseño y el tipo de archivo (gif, png, jpg, pdf, etc.). Yo utilizo todos los siguientes para el OCR japonés:

  • Adobe Acrobat: Esta es una opción obvia para los traductores porque, en general, necesitas suscribirte a Adobe Acrobat para tu trabajo de todos modos. Para realizar el OCR en Adobe Acrobat, abra el archivo de imagen en Acrobat y elija Herramientas -> Escanear y OCR -> Abrir.
  • Google: Esta es una de las mejores herramientas de OCR, y lo mejor de todo es que es completamente gratis. Sube el archivo de imagen a Google Drive, haz clic con el botón derecho del ratón y elige Abrir con Google Docs. La imagen aparece en la parte superior del documento y el texto reconocido aparece debajo. Lamentablemente, Google Docs no hace ningún esfuerzo por preservar la apariencia y el formato del texto, lo que supone un gran inconveniente en comparación con el resto de los programas aquí mencionados.
  • Readiris 17: Readiris es un software comercial de OCR para Windows y Mac vendido por IRIS, una empresa de Canon. A partir de sólo 49 dólares, es una relativa ganga. Se carga el archivo de imagen en Readiris, se especifica el idioma y se guarda como un PDF con capacidad de búsqueda. Tenga en cuenta que no acepta archivos GIF.
  • 読取革命 (Yomitori Kakumei): Este es el único software de la lista que es específico para el idioma japonés. La interfaz y la documentación también son sólo en japonés. Con un precio de 12.980 JPY, es la opción más cara. 読取革命 fue desarrollado originalmente por Panasonic y ahora lo vende SourceNext.

De nuevo, mi experiencia es que no hay un ganador claro, y es difícil predecir qué software dará los mejores resultados de OCR en un archivo de imagen determinado. Por lo general, introduzco el archivo de imagen escaneado en los cuatro, y rápidamente resulta obvio cuál lo maneja mejor.