1
CC-CEDICT - англоязычный аналог 大БКРС
Версия от 2024-02-05 в формате StarDict (конвертирована при помощи PyGlossary).
2024.02.07
ЛС Ответить
2
Инструменты: DictZipUI - сжатие словарных баз
Хотел прикрепить сюда базу Брукс в архиве dictzip для "попробовать". Но файл не прикрепляется.
2022.02.19
ЛС Ответить
3
Инструменты: DictZipUI - сжатие словарных баз
2022.02.14бкрс не очень понимаю смысла, это же просто архиватор. Если это ещё и оболочка, то нужно конвертировать базы в неё.
Нет, не оболочка. DictZip - просто архиватор, который позволяет уменьшить объем базы на диске в 4 раза (последняя база в dictzip 86Мб вместо 340Мб), при этом не замедляя скорость доступа к содержанию.
Почему предлагаю выложить этот инструмент рядом со словарем?
Сам DictZip найти относительно легко. А вот графический интерфейс к нему DictUI в свободном доступе (без СМС и регистрации 1 ) в интернете отсутствует.

Как вариант, можно сразу базу в этом формате выкладывать. Кстати, отпадет надобность делить словарь на 5 частей.
В случае надобности, распаковать можно любым архиватором.
2022.02.19
ЛС Ответить
4
Инструменты: DictZipUI - сжатие словарных баз
2017.09.30бкрс ...программа может пригодится для тех, кто пользуется GoldenDict. Как минимум, знать о такой возможности полезно.

Прошу рассмотреть возможность добавить архив с программой и GUI на эту страницу рядом со словарями.
2022.02.10
ЛС Ответить
5
Есть ли сайт, где можно проверить грамматические ошибки текста на китайском?
2021.06.13游牧人 Короче в китайской версии WPS оказывается есть такая фича. Но проверка правописания доступна только платным пользователям (15 юаней в месяц). И там проверка именно правописания знаков, повторов и т.д. Грамматические моменты не проверяет.
Такая же простейшая проверка уже лет 20 есть в Microsoft Office. В китайской версии есть по умолчанию. В других версия можно добавить, если лицензия позволяет устанавливать разные языковые пакеты. Ищите "Языковые параметры Microsoft Office", а там добавить языки для проверки правописания.
Но проверка там очень простая, кроме повторов, мало что обнаруживает.
2021.06.14
ЛС Ответить
6
Ключи - это "буквы", а иероглифы - это "лигатуры"? (о кодировках)
2018.05.02И виноград При наборе иероглифа на компьютере китайцы всё равно используют обычную клавиатуру и набирают последовательность ключей. Эту последовательность ключей и нужно записывать в компьютере при кодировании текста. Иероглифы же получаются объединением последовательных ключей абсолютно по тем же принципам,
как буквы объединяются в лигатуры: При графическом отображении текста несколько подряд идущих ключей нужно изобразить одним знаком.
То, что вы описали выше, возможно (возможно!) справедливо для корейских иероглифов, но не для китайских.

Цитата:С учётом внесённых поправок, мне пока представляется такая картина.
Конкретно китайцы что-то набирают на обычной клавиатуре. Пускай пиньинь.
Всё равно комбинаций кнопок, набираемых последовательно или одновременным комбинированием, совсем не много: несколько десятков.
Вот их-то и представляется целесообразным сохранять в качестве компьютерной записи текста.
Проблема же отображения сохранённого текста путём формирования иероглифов - это другая проблема,
которую нужно решать по тем же принципам, как формируются лигатуры в европейских языках.
То есть составить "словарь" лигатур, и каждой лигатуре сопоставить свой алгоритм начертания (кодирование векторной графики).
Хотелось бы понять, почему китайцы так не делают? Или делают?
Работу китайского IME будет правильнее сравнить с автокоррекцией на клавиатуре смартфона. Вы набрали только одну букву, а она уже предлагает целые слова. При этом, в зависимости от предыдущего выбора, она самообучается, и каждый раз порядок предлагаемых слов будет разным.
И это правильно. Системы набора должны быть в первую очередь оптимизированы по скорости набора. И к кодировке не должны иметь прямого отношения.
2018.05.03
ЛС Ответить
7
Инструменты: DictZipUI - сжатие словарных баз
2017.09.30бкрс Не должно особо, т.к. файл только раз копируется и больше не трогается.
Система непрерывно пишет, читает и удаляет временные файлы.
На SSD компьютера рекомендуется держать свободным порядка 10-20% места. Иначе неожиданно могут начаться дикие тормоза при копировании новых файлов. Связано это с механизмом "уборки мусора".
Как с этим на телефонах, не знаю. Однако 3 словаря размера БКРС - это у же почти 1ГБ.
Не исключено, что и чтение сжатого файла происходит быстрее. Но это уже вопросы к специалистам.
2017.09.30
ЛС Ответить
8
Инструменты: DictZipUI - сжатие словарных баз
2017.09.30бкрс Получается это только для GoldenDict.
Формат DictZip - своего рода стандарт для словарей. Его многие оболочки поддерживают.
2017.09.30бкрс на практике место редко когда проблема, производительность ценнее.
Влияние на производительность было пренебрежительно малым даже во времена разработки, а при нынешних процессорах об этом можно совсем не задумываться.
По сути это много маленьких ZIP архивчиков в одном флаконе с произвольным моментальным доступом к любому из них (т.е. как к любой странице в очень толстой книге, не нужно листать все старницы подряд, начиная с первой, а открываем сразу нужную).

Так как эта модификация ZIP поддерживается почти всеми архиваторами, то проблем с распаковкой (если нужен исходный файл) нет совсем.

Согласен, что место редко когда проблема, но почему бы и не сэкономить? Общая производительность флэш-памяти от этого только увеличится.
2017.09.30
ЛС Ответить
9
Инструменты: DictZipUI - сжатие словарных баз
Было бы неплохо добавлять сюда ссылки на инструменты для работы с файлами словаря (конвертация и проч.).
Вот например, DictZipUI. Позволяет ужать файл БКРС с 290Мб до 70Бм без существенной потери производительности поиска.
Цитата:Программа предназначена для сжатия dsl / dict / xdxf словарей, что позволяет значительно сэкономить дисковое пространство.
Файлы словарей, сжатые программой DictZip, поддерживаются словарной оболочкой GoldenDict.
Старожилы ее знают и имеют. Консольный вариант легко доступен (например тут).
Но, чтобы найти GUI вариант, мне в свое время пришлось изрядно постараться.
Ссылка.
2017.09.30
ЛС Ответить