Sapomaro
спасибо большое !
а то я уже подумывал , как руки дойдут , вручную...
но это было бы ох как не скоро
спасибо большое !
а то я уже подумывал , как руки дойдут , вручную...
но это было бы ох как не скоро
Sapomaro
спасибо большое ! а то я уже подумывал , как руки дойдут , вручную... но это было бы ох как не скоро 2012.03.12
Здравствуйте, товарищи словаределы!
Вот я недавно раздобыл 21世纪大英汉词典 (да, тот самый что в Pleco!), полезнейший словарь, один из лучших англо-китайских, куча примеров, но в Mdict формате. Нашёл утилиту для конвертации его в чистый txt, конвертнул, но разметка у Mdict всё равно сильно отличается от Lingvo, плюс там очень много CSS тэгов. Я не программист, и регулярные выражения знаю только самые простые, надеюсь, что вы мне поможете сформатировать этот словарь под DSL на общее благо. Вот его .txt исходник - depositfiles.com/files/xy4pkrhrq P.S. Заодно, спрошу, никто не конвертировал базу Wenlin под Lingvo? Судя по этой ссылке формат баз Wenlin таки разобрали. 2012.04.08
Выучили китайский, а регулярки не можете? Не верю
![]() Англо-китайский как-то не актуально. Wenlin неплохой словарь. Та ссылка старая, ее один бкрсников (кто оцифровывал) делал, забыл ник. Больше нигде нет. 2012.04.08
小熊
этот словарь уже давно есть для лигнгво зачем изобретать велосипед ? http://lingvodics.com/dics/details/1737/ 2012.04.08
Это другой словарь, по вашей ссылке всего лишь краткий словарь в обе стороны, просто от того же издателя. А тот что я привёл, это очень известный, очень большой словарь, действительно огромное количество примеров и вариантов перевода. Насколько я знаю, он никогда не был в формате Lingvo, я вообще первый раз нашёл его вне Pleco.
Просто скачайте да посмотрите несколько статей, какие объёмы знатные! 2012.04.08
Прислушался к вашим советам, и стал сам учить регулярки. Действительно не так уж и сложно! Пользуюсь UltraEdit, он поддерживает perl регулярки, включая макро. Уже отформатировал ряд словарей в DSL, попозже выложу.
Хотел бы поинтересоваться у экспертов. Есть у меня один словарь, в традиционном начертании, хотел бы в нём и оставить, но также добавить упрощённые заголовки для карточек для облегчения поиска слов. Как это можно сделать? P.S. Посмотрел конверт CEDICT'а, что в первом посту, есть ошибки. Например, в CEDICT'е "ü" записывается как "u:", надо сначала это поправить, а потом уже добавлять тональные знаки. Если кому интересно, могу выложить свой макро для конвертации CEDICT'а. 2012.04.11
2012.04.11 Выкладывайте, посмотрим, что там. И если не трудно, залейте куда-нибудь 21世纪大英汉词典 в его родном формате, кстати, сколько там заголовков? 2012.04.11 В будущих версиях CEDICT «u:» будет исправлено. Спасибо, что заметили. 2012.04.11
Спасибо, но я уже сам нашёл способ для конвертации только части строк в упрощённое начертание. Просто пометил нужные мне строки особым символом, потом прошёлся по файлу питон скриптом для конвертации традиционных знаков, заранее добавив в скрипт проверку на выше упомянутый символ.
Все mdict словари, включая 21世纪大英汉词典, можно взять здесь. 2012.04.12
|