21
Цитата:4хтомник Ошанина тоже не боги оцифровали.
И никто не ныл, что это "нудно".

хорошо , оцифруйте
достаточно проявить настойчивость с Вашей стороны
вон бкрс обещал Вам обработать первые 100 страниц , я тоже могу , если у Вас есть желание , обработать в Finereader следующие 100.
Главное - будет ли у Вас время и желание заниматься вычиткой и обработкой полученных страниц ?
2011.11.25
ЛС Ответить
22
2011.11.25eksodus
Цитата:4хтомник Ошанина тоже не боги оцифровали.
И никто не ныл, что это "нудно".

хорошо , оцифруйте
достаточно проявить настойчивость с Вашей стороны
вон бкрс обещал Вам обработать первые 100 страниц , я тоже могу , если у Вас есть желание , обработать в Finereader следующие 100.
Главное - будет ли у Вас время и желание заниматься вычиткой и обработкой полученных страниц ?

Вы первое сообщение темы читали?
Я прошу РАСПОЗНАТЬ, если у Вас есть программа для двуязычного распознавания текста.
Остальное я буду делать САМА.
Если есть нормальная программа. Если нет - вопрос снимается, буду сама думать.
秀才不出门全知天下事
2011.11.25
ЛС Ответить
23
Никакая программа не даст вам распознавание один в один как на картинке.
В любом случае - тут очень много ручной работы.
Думаю , Вы видели качество распознавания , по ссылке, что я давал чуть выше.
Каждую из страниц, после распознавания, я обрабатывал часа по 3 . И с эффективностью , примерно в 75%.
После чего уже добавлял-редактировал в БКРС.
Возможно , у Вас это получится быстрее.
Тут нужно каждое слово проверять буквально по иероглифу.
Оцифровать такой объём в одиночку - на это уйдут годы.

Лучше забить на это...
2011.11.25
ЛС Ответить
24
Только что попробовала распознать по странице из каждого словаря в триальной версии файнридера.
Второй словарь вполне читабелен, ошибается только в буквах с ударением.

eksodus, если бы все думали как Вы, прогресс бы остановился.
2011.11.25
ЛС Ответить
25
Я рад , что у Вас получается )
2011.11.26
ЛС Ответить
26
https://bkrs.info/tmp/1-10.zip
Сначала 10 страниц сделал для пробы. Работы, конечно много. Китайский во многих местах даже лучше русского. Первый словарь отсканирован по лучше второго.
Хотя тут смотря как делать. Ведь и необязательно все делать.

2011.11.26
ЛС Ответить
27
2011.11.26бкрс https://bkrs.info/tmp/1-10.zip
Сначала 10 страниц сделал для пробы. Работы, конечно много. Китайский во многих местах даже лучше русского. Первый словарь отсканирован по лучше второго.
Хотя тут смотря как делать. Ведь и необязательно все делать.
О! Я же говорила, что это не безнадежно.
А это Вы Файнридером последним делали?
2011.11.26
ЛС Ответить
28
9ой. Вряд ли в более новых движок распознавания менялся.
2011.11.27
ЛС Ответить
29
Понятно.
2011.11.27
ЛС Ответить
30
2011.11.27Siweida Понятно.

через форум отправлял, не дошло, видимо. скиньте ссылку на словарь в личку.
2011.11.28
ЛС Ответить