Никакая программа не даст вам распознавание один в один как на картинке.
В любом случае - тут очень много ручной работы.
Думаю , Вы видели качество распознавания , по ссылке, что я давал чуть выше.
Каждую из страниц, после распознавания, я обрабатывал часа по 3 . И с эффективностью , примерно в 75%.
После чего уже добавлял-редактировал в БКРС.
Возможно , у Вас это получится быстрее.
Тут нужно каждое слово проверять буквально по иероглифу.
Оцифровать такой объём в одиночку - на это уйдут годы.
Лучше забить на это...
Только что попробовала распознать по странице из каждого словаря в триальной версии файнридера.
Второй словарь вполне читабелен, ошибается только в буквах с ударением.
eksodus, если бы все думали как Вы, прогресс бы остановился.
Я рад , что у Вас получается )
9ой. Вряд ли в более новых движок распознавания менялся.