У кого есть Fine reader?

eksodus

Цитата:4хтомник Ошанина тоже не боги оцифровали.
И никто не ныл, что это "нудно".

хорошо , оцифруйте
достаточно проявить настойчивость с Вашей стороны
вон бкрс обещал Вам обработать первые 100 страниц , я тоже могу , если у Вас есть желание , обработать в Finereader следующие 100.
Главное - будет ли у Вас время и желание заниматься вычиткой и обработкой полученных страниц ?

Siweida

2011.11.25eksodus
Цитата:4хтомник Ошанина тоже не боги оцифровали.
И никто не ныл, что это "нудно".

хорошо , оцифруйте
достаточно проявить настойчивость с Вашей стороны
вон бкрс обещал Вам обработать первые 100 страниц , я тоже могу , если у Вас есть желание , обработать в Finereader следующие 100.
Главное - будет ли у Вас время и желание заниматься вычиткой и обработкой полученных страниц ?

Вы первое сообщение темы читали?
Я прошу РАСПОЗНАТЬ, если у Вас есть программа для двуязычного распознавания текста.
Остальное я буду делать САМА.
Если есть нормальная программа. Если нет - вопрос снимается, буду сама думать.

eksodus

Никакая программа не даст вам распознавание один в один как на картинке.
В любом случае - тут очень много ручной работы.
Думаю , Вы видели качество распознавания , по ссылке, что я давал чуть выше.
Каждую из страниц, после распознавания, я обрабатывал часа по 3 . И с эффективностью , примерно в 75%.
После чего уже добавлял-редактировал в БКРС.
Возможно , у Вас это получится быстрее.
Тут нужно каждое слово проверять буквально по иероглифу.
Оцифровать такой объём в одиночку - на это уйдут годы.

Лучше забить на это...

Siweida

Только что попробовала распознать по странице из каждого словаря в триальной версии файнридера.
Второй словарь вполне читабелен, ошибается только в буквах с ударением.

eksodus, если бы все думали как Вы, прогресс бы остановился.

eksodus

Я рад , что у Вас получается )

бкрс

https://bkrs.info/tmp/1-10.zip
Сначала 10 страниц сделал для пробы. Работы, конечно много. Китайский во многих местах даже лучше русского. Первый словарь отсканирован по лучше второго.
Хотя тут смотря как делать. Ведь и необязательно все делать.

Siweida

2011.11.26бкрс https://bkrs.info/tmp/1-10.zip
Сначала 10 страниц сделал для пробы. Работы, конечно много. Китайский во многих местах даже лучше русского. Первый словарь отсканирован по лучше второго.
Хотя тут смотря как делать. Ведь и необязательно все делать.

О! Я же говорила, что это не безнадежно.
А это Вы Файнридером последним делали?

бкрс

9ой. Вряд ли в более новых движок распознавания менялся.

Siweida

Понятно.

WTiggA

2011.11.27Siweida Понятно.

через форум отправлял, не дошло, видимо. скиньте ссылку на словарь в личку.