Показаны наиболее выделенные сообщения темы
Всего реакций в теме: 444
Вернуться в полную тему >>>
1
>>>
Если вдруг найдутся энтузиасты, то напишите, могу помочь с технической частью.
Плюс удалось откопать какие-то наработки по оцифровке корейского словаря от 2005 года, можно взять их за основу (30к статей).
К тому же есть техническая возможность подготовить двухтомник словаря Никольского к оцифровке (пересканить, чтобы сделать черновой OCR с минимально возможным количеством ошибок, нарезать на отдельные изображения, потом можно встроить это в онлайн-словарь, чтобы 1) пользователи могли искать по черновому OCR 2) пользователи могли править OCR, формируя полноценные статьи )
2022.11.26
ЛС Ответить
2
>>>
zlatko,
2016.02.18zlatko Большой Корейско-русский словарь не получилось оцифровать, слишком мало изучающих, чтобы набрать столько энтузиастов.
Жаль, идея хорошая. Может со временем все же наберется "критическая масса"?
2016.02.19
ЛС Ответить
3
>>>
Небольшой апдейт по Никольскому, я раздобыл оба тома, пересканировал в нормальном качестве, прогнал через OCR. Дальше надо будет нарезать страницы на отдельные изображения со статьями и почистить основные ошибки оцифровки. Задался вопросом, что дальше со всем этим добром делать --
1) выложить на гитхабе по аналогии с Вародаем https://github.com/warodai/warodai-source , а там уже если кому-то будет интересно, то подхватит инициативу по дальнейшему редактированию статей. В худшем случае просто полежит до лучших времён.
2) делать полноценный редактируемый онлайн-словарь (как я предлагал выше) и прикручивать к нему сбоку возможность работы с отсканированными словарями. Технически задача несложная, но тут сложность с тем, что для ведения такого проекта нужен кто-то с приличным пониманием корейского (хотя бы проверять предложенные правки), но из знакомых кореистов никто не захотел в это ввязываться, мол, вы конечно молодцы, редактируемый словарь это хорошо, удачи вам там с этим проектом и хорошего настроения, а мы к наверу привыкли. Если вдруг есть желающие, заинтересованные или их знакомые, напишите пж в телеграме (ник тот же)
2022.12.27
ЛС Ответить
4
>>>
Так-с, ну спустя год кореистов-энтузиазстов (не)ожидаемо не появилось, а знакомые-кореисты, которых спрашивал, вообще покрутили пальцем у виска, мол, на кой твой Никольский нужен в 21 веке. По "аналогу БКРС"/редактируемому корейскому словарю в целом ситуация похожая, людей существующие решения вполне устраивают.
Сейчас дошли руки навести порядок на диске, оформил OCR Никольского в некий сервис https://bkors.nyars.org/
Пускай лежит до лучших времён, может, лет через 10 сам запишусь в корейскую тусовку, никогда не знаешь, куда жизнь занесёт.
2023.11.29
ЛС Ответить
5
>>>
Lillily,
Картинки https://bkors.nyars.org/static/img.zip (900 Мб почти)
Текст https://bkors.nyars.org/static/ocr-list.zip

Мне кажется, проще редактировать не по отдельным картинкам, а просто djvu/pdf словарь открыть и по странице целиком смотреть.

Конечно, если будете редактировать, желательно, работать не в стол, исправленный файл я могу на сайт загрузить. + постараюсь редактор добавить, как будет время.
2023.11.29
ЛС Ответить
6
>>>
Добавил выгрузку в файл + редактор + систему правок с простенькой авторизацией (правки можно и анонимно оставлять)
Плюс теперь есть страничка, на которой можно посмотреть все статьи с одной физической страницы словаря (может удобно будет для массовой правки, открывается по клику на "Page" на статье в поиске)

Делалось на коленке, так что возможны косяки eyes
2023.12.10
ЛС Ответить