17дбкрс Да, это оно было, видимо уснул. Получается Mdict это самый ресурсоёмкий формат.
Да, и как написал выше, его предстоит доделать. Возможно в итоге будет немного быстрее конвертировать.
У меня на смартфоне эти пункты -
StarDict: bkrs+bruks+examples,
MDict: bkrs+bruks+examples,
DSL: bkrs+bruks+examples,
HTML: bkrs+bruks+examples
- конвертируются за 56 минут.
Сейчас все доделки оставил на потом.
mcx_v10 — PHP конвертер словарных баз - DSL, 大БКРС и CC-CEDICT в StarDict, MDict и HTML. dictz_v2 — браузерный dictzip компрессор для словарей (DSL, StarDict и др.)
18дбкрс Сделал версию, естественно 天壤之别 по сравнению с моим предудущем опытом. Вопрос конвертации, благодаря вашему конвертору решён.
Цитата:Кое чем пришлось поступиться, в ручную всегда качественней, но главное, что меня теперь не тошнит от "опять нужно версию делать, день на смарку". Всё-таки, автоматизация это вещь.
Чем пришлось поступиться? Можно доавтоматизировать?
Цитата:Пользуюсь таки опцией архивирования что в начале не хотел, 7zip конечно существенно лучше сжимает, но экономия времени большая и скачать на несколько даже десятков мегабайт больше раз в пол года сейчас мизер и на сервере трафика достаточно.
В последних версиях php можно сжимать методом lzma2 (7z)
Цитата:Отказался от версий (последняя была 93), сейчас весрия будет дата типа 250314.
Цитата:Форматы нужно проверить в оболочках, но если кто будет пользоваться, ошибки вылезут, если они есть.
Файлов конечно многовато, раньше один формат был, а сейчас 4, возможно, некоторые буду делать реже.
Я проверял, пока всё выглядит безупречно. Поскольку конвертация теперь простая и быстрая, возможно следует чаще обновлять ссылки на скачивание всех форматов, не только dsl. Или, было бы здорово, если кто-то из участников выкладывал "full conversion" на яндекс диск раз в 3-4месяца (все форматы :dsl,mdict,html,stardict). Думаю это вполне актуально при живом словаре.
mcx_v10 — PHP конвертер словарных баз - DSL, 大БКРС и CC-CEDICT в StarDict, MDict и HTML. dictz_v2 — браузерный dictzip компрессор для словарей (DSL, StarDict и др.)
16дmcx Чем пришлось поступиться? Можно доавтоматизировать?
При ручной конвертации dsl я проверял на ошибки, компилируя его в lsd. Естественно, это можно делать и сейчас, но теперь уже как самостоятельная процедура. С конвертацией это связано лишь потому что удобно вместе с новым dsl делать, а т.к. сейчас всё быстро, то даже лень этим занимать. Там иногда мелькают хорошие ошибки.
Ещё возможная полезная опция - добавлять текстовый файл в архив. Или готовый файл в папке или переменная в опциях или тектэриа на странице. Для ридми/инфо.
6дбкрс Ещё возможная полезная опция - добавлять текстовый файл в архив. Или готовый файл в папке или переменная в опциях или тектэриа на странице. Для ридми/инфо.
Я же написал "Для ридми/инфо". Описание, инструкция при необходимости, откуда скачено, т.к. ссылку могут давать прямую.
Не соображу можно ли в ручную добавить текстовый файл в не/запароленный ахив без перепаковки, если можно то не так актуально, но всё равно было бы полезно.
бкрс,в description везде указывается адрес этого сайта.
Смотрите :
● в stardict - файл *.ifo (=info);
● в приложениях mdict в меню информация о словаре;
● в html, настройки -> информация ;
● в dsl - файл *.ann (=annotation).
В description можно задать любой текст перед началом конвертации, в readme.txt написано.
dictz, так там для оболочек, а не для чтения, он где-то в глубине оболочки отображается после того как добавил словарь (по крайне мере ann).
Речь о когда распаковываешь архив, там сразу висит README.txt/INFO.txt и при необходимости туда можно что угодно добавить и он хорошо виден.
Это не критичная важность, из разряда полезной фичи.
Можно упомнять источник, долгую индексацию, ссылку на коневертор, на базы, на тему. Может какие-то особенности, которые потом всплывут (поломанные ссылки если по частям?)
бкрс, незнаю насколько актуально продолжать доделывать php конвертер. Всё основное уже есть и работает приемлемо.
Возможно стоит сделать браузерный конвертер, хорош такой был бы тем, что ненужен локальный php сервер, а значит гораздо проще использовать (один большой плюс). Из минусов:
- скорее всего не будет мультивыбора,
- возможно чуть медленнее,
- отсутствие некоторых опций.
Принцип почти как в dictz: выбираем исходный файл (будет dsl или cedict), после завершения конвертации нажимаем сохранить, и браузер сохранит tar архив с файлами в папку download .
Конвертор по сути готов, доделывать можно вечно. Я бы не мучился и отнёс его к "сделано", даже если ещё что-то будет, то это отдельно.
Другое возможное направление кроме браузера - серверное, чтобы скрипт прям на сервере всё это перерабатывал без перезакачивания туда обратно. Но разработка сложнее и смысла нет, если я 1-2 раза в год им буду пользоваться, проще пару минут на скачку потратить. Плюс на сервер лучше лишний раз не дышать.