2023.12.07dsx
А у вас на сайте есть аналогичный список по синоглифам ? (разнопись, 嗎 = 吗) А то нашел базу на ~10тыс и не знаю насколько она полна.


2023.12.07 ![]() ![]() 2023.12.08
2023.12.07 Какая-то странная база, если честно. Если вам нужны списки для конвертации традиционки/упрощёнки, возьмите из OpenCC, довольно популярный конвертер, так что думаю базы там плюс минус полные https://github.com/BYVoid/OpenCC/tree/master/data/dictionary 2023.12.08
2023.12.08 Наверное, я говорил об обычных списках в китайском интернете. Специализированные списки, где по шрифту идёт, а не по китайскому, полнее. 2023.12.08
2023.12.08Да, возможно её нужно просеять. Пока мало время чтобы погрузиться в поиск должным образом. Это первое что попалось. Спасибо за ссылку, посмотрю. В идеале бы найти официальный список от самих реформаторов, если он существует. Ещё я смотрю на эту проблему шире - мне нужны все синоглифы последней версии юникода. 2023.12.08
2023.12.04 Нормально ищет, лишь подвисает при открытии. На старте потребление оперативки двойное 250х2. Можно разбить словари на части и загружать очередью 2023.12.13
2023.12.13 Спасибо 👍. Замечал в диспетчере всплеск потребления памяти, как бы логично, сначало html скачивается/читается, потом парсится-компилируется в рабочий вид и в конце исходник удаляется. Позже загляну подумаю. 2023.12.13
Файлы пока не обновлял, поделюсь данными новых тестов с применением "загрузки частями". Результаты меня удивили:
2023.12.05 Теперь можно избавиться от облегчённого варианта . Учитывая ещё как быстро тут обновляются словарные базы, постараюсь в обновленную версию включить и обновлённые базы. 2023.12.15
2023.12.15
2023.12.15Значит у вас в оперативку упирается. Как я понимаю, если её достаточно, разницы большой не будет. Хотя я не понимаю что именно там загружается, всё равно при поиске всё целиком загружено будет. 2023.12.16
2023.12.16 В итоге так и есть, но javascript движок браузера устроен непонятно, если один большой массив-словарь поместить в один тег <script> то он будет дольше его переваривать при открытии html. Планшет digma a100, 1гб ОЗУ мог открыть только облегченный вариант ~50мб. Если же массив разбить на кусочки, каждый поместить в отдельный <script> и сращивать эти кусочки по мере загрузки каждого <script> , то открытие html ускоряется значительно, и памяти использует меньше. Теперь дигма открывает полный вариант ~100мб, и даже примеры тянет, но если отдельным. 2023.12.16
|