Страницы (3): « Предыдущая 1 2 3
21
Sapomaro
спасибо большое !
а то я уже подумывал , как руки дойдут , вручную...
но это было бы ох как не скоро
2012.03.12
Ответить
22
Здравствуйте, товарищи словаределы!

Вот я недавно раздобыл 21世纪大英汉词典 (да, тот самый что в Pleco!), полезнейший словарь, один из лучших англо-китайских, куча примеров, но в Mdict формате. Нашёл утилиту для конвертации его в чистый txt, конвертнул, но разметка у Mdict всё равно сильно отличается от Lingvo, плюс там очень много CSS тэгов. Я не программист, и регулярные выражения знаю только самые простые, надеюсь, что вы мне поможете сформатировать этот словарь под DSL на общее благо.

Вот его .txt исходник - depositfiles.com/files/xy4pkrhrq

P.S. Заодно, спрошу, никто не конвертировал базу Wenlin под Lingvo? Судя по этой ссылке формат баз Wenlin таки разобрали.
2012.04.08
Ответить
23
Выучили китайский, а регулярки не можете? Не верю Smile
Англо-китайский как-то не актуально.

Wenlin неплохой словарь. Та ссылка старая, ее один бкрсников (кто оцифровывал) делал, забыл ник. Больше нигде нет.
2012.04.08
Ответить
24
小熊
этот словарь уже давно есть для лигнгво
зачем изобретать велосипед ?
http://lingvodics.com/dics/details/1737/
2012.04.08
Ответить
25
Это другой словарь, по вашей ссылке всего лишь краткий словарь в обе стороны, просто от того же издателя. А тот что я привёл, это очень известный, очень большой словарь, действительно огромное количество примеров и вариантов перевода. Насколько я знаю, он никогда не был в формате Lingvo, я вообще первый раз нашёл его вне Pleco.

Просто скачайте да посмотрите несколько статей, какие объёмы знатные!
2012.04.08
Ответить
26
Прислушался к вашим советам, и стал сам учить регулярки. Действительно не так уж и сложно! Пользуюсь UltraEdit, он поддерживает perl регулярки, включая макро. Уже отформатировал ряд словарей в DSL, попозже выложу.

Хотел бы поинтересоваться у экспертов. Есть у меня один словарь, в традиционном начертании, хотел бы в нём и оставить, но также добавить упрощённые заголовки для карточек для облегчения поиска слов. Как это можно сделать?

P.S. Посмотрел конверт CEDICT'а, что в первом посту, есть ошибки. Например, в CEDICT'е "ü" записывается как "u:", надо сначала это поправить, а потом уже добавлять тональные знаки. Если кому интересно, могу выложить свой макро для конвертации CEDICT'а.
2012.04.11
Ответить
27
2012.04.11小熊 ...но также добавить упрощённые заголовки для карточек для облегчения поиска слов. Как это можно сделать?

Выкладывайте, посмотрим, что там. И если не трудно, залейте куда-нибудь 21世纪大英汉词典 в его родном формате, кстати, сколько там заголовков?

2012.04.11小熊 P.S. Посмотрел конверт CEDICT'а, что в первом посту, есть ошибки.

В будущих версиях CEDICT «u:» будет исправлено. Спасибо, что заметили.
2012.04.11
Ответить
28
Спасибо, но я уже сам нашёл способ для конвертации только части строк в упрощённое начертание. Просто пометил нужные мне строки особым символом, потом прошёлся по файлу питон скриптом для конвертации традиционных знаков, заранее добавив в скрипт проверку на выше упомянутый символ.

Все mdict словари, включая 21世纪大英汉词典, можно взять здесь.
2012.04.12
Ответить
Страницы (3): « Предыдущая 1 2 3