No lo sé. Pero déjame adivinar.
En primer lugar, hay un par de cosas sobre la escritura de los caracteres chinos que podrías utilizar en tu beneficio:
- el número de trazos.
- hay un orden correcto de los trazos.
- cada trazo tiene un lugar donde empieza y termina.
- cada trazo tiene un camino que traza.
Supongo que podrías tener bastante éxito simplemente dividiendo el espacio de escritura en una cuadrícula muy aproximada, y para cada trazo, llevar la cuenta de dónde empieza y termina. Luego cuenta el total de trazos.
Se puede refinar a partir de ahí, pero no tiene que ser perfecto, ya que se presentan las opciones al final. Como un buen bono, podrías intercambiar el algoritmo ya que tienes una buena manera de determinar el éxito del algoritmo: el porcentaje de veces que aparece el personaje correcto, y el porcentaje de veces que el personaje aparece como primera opción.
Pero mi opinión es que un algoritmo ingenuo como ese funcionaría con bastante facilidad.
Por cierto, los diccionarios de caracteres japoneses a veces se organizan primero por número de trazos, y luego por los componentes. Hay un conjunto estándar de componentes y un ordenamiento estándar para ellos.
He escrito software para reconocer números en inglés y he utilizado una estrategia similar.