Страницы (13): « Предыдущая 1 ... 5 6 7 ... 13 Следующая » Переход на страницу  +
51
Добавлен новый китайско-китайский сателлит «Taiwan national language dictionary» (скорее всего 國語辭典). Кто-то тут скидывал. Упрощенные.

Крайне полезный словарь, я такого не ожидал. Думал там старьё, типа 汉语大词典, но ошибся. Это современный словарь, хотя и вэньяньское там присутствует.
Благодаря ему теперь появилось много китайских толкований для слов, которых раньше не было. И такое ощущение, что оригинальный БКРС во много черпал лексику отсюда.

Отличные современные примеры для современных слов и вэньяньские для старых.

Определить его легко - по зелёному слову 拼音. Пиньинь, кстати, это единственный минус. Скорее всего, его автоматом проставили, так как он слишком часто отсутствует (нейтральный), что для 国语 как раз нетипично. 夫妻 fu qi, 冬烘先生 dong hong xian sheng. Подумываю убрать его вообще, разве что для иероглифов отставить.

Словарь по объёму большой:
всего слов - 153 759
новых в 大БКРС - 29 145 (!)

Случайная выборка новых слов:
黑衫队
黑轮
黑醋
黑金政治
黑键
黑霉菌
黑驴告状
黑黝
黑黶子
黑龙会
默无一言
не такой уж и шлак, чего я никак не ожидал, думал 大БКРС под завязку лексикой набит.
2013.06.11
Тема Ответить
52
2013.06.11бкрс не такой уж и шлак, чего я никак не ожидал, думал 大БКРС под завязку лексикой набит.

Да, неплохо. Еще вчера хотела добавить слово 连身裙, тк его не было. А сегодня уже есть.

2013.06.11
Тема Ответить
53
И опять в упрощённых...

А ничего, что там от автоконвертации море ошибок? Хотя бы с иероглифами 乾 и 著.

У меня есть в традиционных, в .dsl формате. База 國語辭典 недавно в open source вышла, я конвертировал с оригинала. С нормальным пиньинем и ещё синонимами/антонимами.

У Вас скорее всего ещё старый горе-дамп, который материковые китайцы скриптом с оригинального сайта дампили, а потом автоматом упрощали. Там море ошибок и битых статей. В моей чистой базе 164877 статей, не считая редких вариантных иероглифов, которые пришлось порезать из-за несовместимости тамошнего кастомного расширения Big 5 с нормальным Unicode.
2013.06.11
Тема Ответить
54
2013.06.11小熊 И опять в упрощённых...
Что значить "опять"? У нас же всё автоматически преобразуется, традиционные карточки увидеть невозможно. Иначе всё существенно усложнится.

2013.06.11小熊 А ничего, что там от автоконвертации море ошибок? Хотя бы с иероглифами 乾 и 著.
Скорее всего есть, но так как они у нас изначально есть, вряд ли там много новых. Хотя надо было проверять чтение и сразу исправлять.

Цитата:У Вас скорее всего ещё старый горе-дамп, который материковые китайцы скриптом с оригинального сайта дампили, а потом автоматом упрощали.
Возможно. Но как я понял, ничего лучше сейчас в упрощённом нет. Как появится нормальная с пиньинем, то я просто заменю сателлит.

Цитата:База 國語辭典 недавно в open source вышла, я конвертировал с оригинала. С нормальным пиньинем и ещё синонимами/антонимами.
Если как-нибудь выложите, киньте, пожалуйста, ссылку, я попробую автоматом упростить, если будет лучше чем сейчас, заменю. Мне чтение очень не нравятся.

В любом случае, словарь совсем не шлаковый, а наоборот крайне качественный. То что в упрощённых там будут ошибки типа 著着者 - к этому не привыкать, пользы от него гораздо больше.
2013.06.11
Тема Ответить
55
Я тут недавно с одним товарищем делал корректные упрощённые заголовки для 國語辭典. Проблемные иероглифы вроде 乾 и 著 мы упрощали исходя из пиньиня. Т.е. если у 乾 в этом слове чтение qián, то он не упрощается в 干, это позволяет избежать таких курьёзов как 饼乾, 着作 и пр. В 國語辭典 к каждому слову даётся чтение, и ошибок я не встречал, так что наши заголовки на 99% корректны.

Предлагаю использовать мою чистую базу с упрощёнными заголовками и традиционными статьями в качестве сателлита, заместо Вашего огрызка. Но на условии, что сами статьи Вы гарантируете не портить скриптом конвертации в упрощённые.

Словарь -- старый и богатый. Мне лично такие надругательства неприятны.
2013.06.11
Тема Ответить
56
2013.06.11小熊 на условии, что сами статьи Вы гарантируете не портить скриптом конвертации в упрощённые.
Чтобы каждый кто захочет им воспользоваться копировал текст в ближайший конвертатор и конвертировал его там? Из-за мизерной доли 著 и 乾 в упрощённом китайском?
Не хотелось бы чтобы он висел только ради красоты, нужна практичность.

Мне почему-то кажется, что это вы этот файл где-то здесь выкладывали, я его скачал и оставил до лучших времён. Точно не помню откуда он. Там dsl словарь в традиционных и урощённых. "Конвертация в формат Abbyy Lingvo - fromnuaa, email: fromnuaa@yahoo.com.cn" (вроде, китаец)
2013.06.11
Тема Ответить
57
Нет, не выкладывал. Моя .dsl конвертация 國語辭典 включает двойные заголовки, поиск по пиньиню и прочие плюшки. В Интернете её точно нет.

Моё дело -- предложить сделать по-человечески. Ваше дело -- отказаться. Зря, кстати, по себе мерите. Если человек свободно читает упрощённый китайский, то и традиционный для него проблем не составит. Ваше просто 红卫兵овское упрямство и отношение к источникам знаний несомненно огорчают.
2013.06.11
Тема Ответить
58
Не думал, что у вас "особые чувства" к традиционным.
Для меня они не более чем как другой шрифт иероглифов. Если можно использовать знакомый шрифт, зачем мучить глаза?

Если бы у нас здесь все свободно читали по-китайски, сайта бы вообще не существовало, чтение оригинальх текстов не предполагает, что оно свободное, особенно богатых лексикой словарей. Да и далушные китайцы при прочих равных всегда выберут упрощённые.
2013.06.11
Тема Ответить
59
бкрс, это я выкладывал этот словарь
в упрощённых и традиционных иероглифах
спасибо, что наконец-то его добавили в сателлиты, хоть и почти год спустя -
словарь действительно хорош, хоть и имеет небольшие ошибки
小熊 , - что вам мешает выложить вашу улучшенную версию словаря,
чтоб её сконвертировали в упрощённые и добавили в БКРС ?
а самому пользоваться ещё как дополнительным словарём - вашим неконвертированным ?
2013.06.11
Тема Ответить
60
2013.06.11eksodus 小熊 , - что вам мешает выложить вашу улучшенную версию словаря,
чтоб её сконвертировали в упрощённые и добавили в БКРС ?

мешает гордость или жадность
2013.06.12
Тема Ответить
Страницы (13): « Предыдущая 1 ... 5 6 7 ... 13 Следующая » Переход на страницу  +