21
2022.11.26hgw196 Этот сайт — лучший пример такого подхода.
Тема же называется "Аналог БКРС для корейского языка".
Смысл в том, чтобы разделить оцифровку и сам словарь. Она должна работать по принципу сателлитов в БКРС, то есть подтягиваться куском скана к открытой статье, только с той разницей, чтобы по оцифровкам можно было искать отдельно от основного словаря. Тогда правки в основном словаре не затронут оцифровку.

В БКРС тоже можно было бы добавить Ошанинский БКРС сателлитом, чтобы люди могли пользоваться оригинальными статьями (например, если необходима академическая ссылка), но тут осложняется тем, что
1) выпилены традиционки (не будет работать синхронизация статей из сателлитов и статей из основного словаря, если хранить их раздельно и подтягивать по заголовку)
2) нет поиска по сателлитам
3) сателлиты не подписаны, не разобрать, что откуда взято.
По идее в корейском словаре всех этих трёх пунктов можно избежать.

Ну насчёт полной оцифровки не могу сказать, как будет. Если автоматизировать всё это дело, дальше будет вопрос только в том, найдётся ли пара фанатиков, чтобы погрузиться в процесс. Тогда это меньше, чем за год будет возможно. Пусть даже этого не случится, возможность искать по OCR, даже с ошибками, уже значительный плюс.
2022.11.26
ЛС Ответить
22
etsune, по Никольскому хотя бы индекс сделать, уже хорошо. У китайцев есть куча таких словарей в формате .mdx, где можно просто искать по бумажному словарю, нарезанному на страницы.

Словарь Никольского это же по большей части китайский словарь. Сейчас открыл рандомную страницу, там есть что-то такое:


Все эти слова (乘客, 升啓, 承繼, 昇階/陞階(升階),勝計) есть и в китайских словарях, но иногда отсутствуют у Ошанина, так что и для китайско-русского словаря они были бы полезны.

Есть слова из корейского извода классического китайского:





Но иногда ещё бывают странные формы ханджа — вот тут, например, слово 昇叙/陞敘/陞敍 написано с ⿰余友, это даже в zi.tools не находится.

2022.11.27
ЛС Ответить
23
Был такой хороший словарик Б.Г. Мудрова тыщ на 60, человека с тростью, так вот он также норм, и даже переведен на английский, коий я и купил как-то раз будучи в Москве проездом. А раз переведен, значит есть в нем толк, использует поиск по чертам, а в английском есть и поиск по пин-ин.
Вообще, конечно, составить правильный словарик из всех возможных источников - это дело всей жизни. К такому процессу надо привлекать профессиналов.
2022.11.27
ЛС Ответить
24
Небольшой апдейт по Никольскому, я раздобыл оба тома, пересканировал в нормальном качестве, прогнал через OCR. Дальше надо будет нарезать страницы на отдельные изображения со статьями и почистить основные ошибки оцифровки. Задался вопросом, что дальше со всем этим добром делать --
1) выложить на гитхабе по аналогии с Вародаем https://github.com/warodai/warodai-source , а там уже если кому-то будет интересно, то подхватит инициативу по дальнейшему редактированию статей. В худшем случае просто полежит до лучших времён.
2) делать полноценный редактируемый онлайн-словарь (как я предлагал выше) и прикручивать к нему сбоку возможность работы с отсканированными словарями. Технически задача несложная, но тут сложность с тем, что для ведения такого проекта нужен кто-то с приличным пониманием корейского (хотя бы проверять предложенные правки), но из знакомых кореистов никто не захотел в это ввязываться, мол, вы конечно молодцы, редактируемый словарь это хорошо, удачи вам там с этим проектом и хорошего настроения, а мы к наверу привыкли. Если вдруг есть желающие, заинтересованные или их знакомые, напишите пж в телеграме (ник тот же)
2022.12.27
ЛС Ответить
25
etsune, сама корейским владею плохо, но кину клич в сообществе кореистов.
秀才不出门全知天下事
2022.12.29
ЛС Ответить
26
2022.12.29Siweida в сообществе кореистов.
а это он-лайн форум или в каком-то другом виде?
2022.12.30
ЛС Ответить
27
2022.12.27etsune что дальше со всем этим добром делать --
1) выложить на гитхабе по аналогии с Вародаем

как минимум

2022.12.27etsune Технически задача несложная

каким стеком реализовывать собираетесь?
2022.12.30
ЛС Ответить
28
etsune, напишите, пожалуйста, сколько нужно добровольцев-кореистов и что конкретно нужно будет делать. И где-как. Я репостну в сообществе, где тусят изучающие корейский язык. Может, кто найдется.
2022.12.30
ЛС Ответить
29
2022.12.30Бескорыстный Лотос каким стеком реализовывать собираетесь?
Посмотрим по ситуации. Если вдруг наберётся народ и нужно будет по-быстрому прототип сделать, то на основе существующего яп словаря с ASP.NET Core, если в расслабленном режиме и в опенсорс, то на Rust. Фронтенд Vue.js

2022.12.30Siweida etsune, напишите, пожалуйста, сколько нужно добровольцев-кореистов и что конкретно нужно будет делать. И где-как. Я репостну в сообществе, где тусят изучающие корейский язык. Может, кто найдется.
Большое спасибо. Мне для начала нужен хотя бы 1 (но лучше больше) заинтересованный кореист, чтобы мог проконсультировать по самому языку, а в последствии взялся бы за проверку пользовательских правок. То есть люди, кто хотел бы именно поучаствовать (хотя бы дискуссионно) в разработке, предлагать идеи по функционалу словаря, ну и в целом давать какой-то фидбек на начальных этапах.
Написать можно мне в телеграме @etsune
2022.12.31
ЛС Ответить
30
Так-с, ну спустя год кореистов-энтузиазстов (не)ожидаемо не появилось, а знакомые-кореисты, которых спрашивал, вообще покрутили пальцем у виска, мол, на кой твой Никольский нужен в 21 веке. По "аналогу БКРС"/редактируемому корейскому словарю в целом ситуация похожая, людей существующие решения вполне устраивают.
Сейчас дошли руки навести порядок на диске, оформил OCR Никольского в некий сервис https://bkors.nyars.org/
Пускай лежит до лучших времён, может, лет через 10 сам запишусь в корейскую тусовку, никогда не знаешь, куда жизнь занесёт.
2023.11.29
ЛС Ответить