+
1
Мне несколько сложно сформулировать вопрос, но список семантических радикалов более-менее общепризнан. Ну, то есть, их несколько, но допустим КанСи 214 покрывает вполне прилично то, что нужно новичку.

А вот есть ли список частоупотребимых фонетических компонент? Вот, скажем,

付 работает как "fu" в 付,府, 腐, а также ещё примерно в 40 значках, плюс как "bo", "bu", "pou" ещё примерно в 20 экзотических.

То есть, кажется, что покрытие фонетиками самых популярных 6000 должно быть хорошим. Естественно, это для путунхуа, но пока и его хватит.

Делал ли кто-нибудь такой список?
2019.10.07
Тема Ответить
2
正松亡,
Цитата:Делал ли кто-нибудь такой список?
Иероглифы не являются логичной системой детерминантов (семантический компонент) + фонетик. Следы такой системы, которые наблюдаются, имеют только исторический интерес. Ключи же нужны для поиска иероглифа в словаре.
2019.10.07
Тема Ответить
3
Не вижу почему исторический интерес -- это плохо.

Также не вижу ничего плохого в том, чтобы иметь ещё один способ систематизации иероглифов (по фонетическим компонентам). Да, он не будет полным, ну так и семантический тоже неполон, и на многие иероглифы он натянут, и как следствие, ни один метод ввода напрямую его не использует. (В Unihan тысячи значков, для которых он непонятен.) И его тоже можно было бы использовать для поиска в словаре.

А ежедневную работу такой индекс упростил бы.
2019.10.07
Тема Ответить
4
2019.10.07正松亡 А вот есть ли список частоупотребимых фонетических компонент? Вот, скажем,

https://yadi.sk/i/GBokwHeIlaSuPg такой?
2019.10.07
Тема Ответить
5
正松亡,
Цитата:Не вижу почему исторический интерес -- это плохо.
Я этого не говорил.
2019.10.07
Тема Ответить
6
2019.10.07与纳奖 https://yadi.sk/i/GBokwHeIlaSuPg такой?

Класс, ровно то, что надо.

Интересно бы ещё посчитать покрытие, но это я как-нибудь сам сделаю, должно извлекаться из cc_cedict.

А у этого списка есть название?
2019.10.07
Тема Ответить
7
Занимаюсь собственным исследованием фонетиков примерно десяток лет.
Не знаю точно, как они называются в китайском, но в японском один из вариантов наименования - 音符.
Начиналось все с таблицы в Word, затем список перекочевал в таблицы Excel.
Пытался использовать VB-макросы, но и здесь возникли проблемы. Например, некорректная работа макроса с расширенным диапазоном символов Юникода.
После этого предпринял попытку перенести проект на HTML и JavaScript (текущий этап).
Задумка была в том, чтобы, используя готовую базу иероглифов Unihan, добавить в нее собственно поле с информацией о фонетике с его чтениями на путунхуа, японском, корейском и кантонском.
Фонетики ищу вручную, используя в основном сайт zdict.net. До обнаружения всех фонетиков еще очень далеко.

Основные сложности, с которыми приходится столкнуться:

1. Определение струкуры фонетика.
Например, что считать фонетиком в иероглифе 湖 - 古 или 胡?
С одной стороный, логично было бы считать фонетиком минимальную структуру, при дроблении которой фонетик перестает быть таковым, т.е. в данном случае 古.
С другой стороный, часто удобно представлять иероглиф-фоноидеограмму в виде суммы ключа и фонетика без остатка. Тогда фонетиком будет выступать 胡.

2. Отсутствие фонетика в Юникоде.
Случается, что фонетик представляет из себя набор графем, не совпадающих ни с ключом, ни с каким-либо самостоятельным иероглифом.
Например, фонетиком иероглифа 穀 будет этот же иероглиф за вычетом 禾. Для таких случаев я использую свой кастомный шрифт, в котором создаю нужный знак.

3. Исключения из правила фонетика.
Понятно, что фонетик не определяет чтения всех иероглифов под ним однозначно. Тем не менее, зачастую есть общее правило.
Могут возникать чередования вида lan-nan, qiao-liao и т.п., где финали, как правило подчиняются правилу четче, чем инициали.
Однако часто бывает так, что в ряду чтений фонетика возникает исключение в виде явно выбивающегося чтения, например lan-nan-chi.
Выяснение того, откуда это исключение взялось - тема отдельного исследования.

4. Вариации иероглифов.
И наконец, существование как минимум трех типов начертания иероглифов - китайское традицинное, китайское упрощенное и собственные японские сокращения - также усложняет картину.
Если брать за основу то, что ближе к корням, т.е. китайское традиционное начетание, то это может негативно сказаться на возможности практического применения результатов данного исследования. Если же брать упрощенные начертания, то какие - китайские или японские? Попытка же усидеть на трех стульях может привести к усложнению представления результатов.

В дальнейшем я планирую перенести проект в SQL-базу данных (тем более моя теперешняя работа связана с этим), а в качестве интерфейса использовать Web-приложение на JAVA или Python-скрипт. Но когда это будет - сказать тяжело.

Если говорить о работах на схожую тему, то есть у меня японский словарь фонетиков (см. картинки ниже).
С поправкой на японские варианты начертания некоторых иероглифов, в общем его можно использовать для ознакомления с основныи фонетиками.
Словарь покрывает иероглифы, необходимые для сдачи экзамена 日本漢字能力検定. Это порядка 6000 знаков.

Мое web-приложение можно скачать по ссылке ниже. Архив нужно распаковать и запустить файл home.html.
Практической пользы от текущей версии немного, но с основной идеей ознакомиться можно.

Подводя итог, могу сказать, что особой практической пользы в глубоком изучении фонетиков я не обнаружил.
Если традиционные ключи - это исторически сложившаяся система, то фонетики каждый собирает под свои нужды и в этом смысле исползование чужих наработок особой пользы скорее всего не принесет. Основные фонетики и вариации чтений вы и без этого усвоите в процессе изучения языка. А это скорее форма медитации или даже заболевания.

Fonetics Research




2020.01.08
Тема Ответить
+