Занимаюсь собственным исследованием фонетиков примерно десяток лет.
Не знаю точно, как они называются в китайском, но в японском один из вариантов наименования - 音符.
Начиналось все с таблицы в Word, затем список перекочевал в таблицы Excel.
Пытался использовать VB-макросы, но и здесь возникли проблемы. Например, некорректная работа макроса с расширенным диапазоном символов Юникода.
После этого предпринял попытку перенести проект на HTML и JavaScript (текущий этап).
Задумка была в том, чтобы, используя готовую базу иероглифов Unihan, добавить в нее собственно поле с информацией о фонетике с его чтениями на путунхуа, японском, корейском и кантонском.
Фонетики ищу вручную, используя в основном сайт zdict.net. До обнаружения всех фонетиков еще очень далеко.
Основные сложности, с которыми приходится столкнуться:
1. Определение струкуры фонетика.
Например, что считать фонетиком в иероглифе 湖 - 古 или 胡?
С одной стороный, логично было бы считать фонетиком минимальную структуру, при дроблении которой фонетик перестает быть таковым, т.е. в данном случае 古.
С другой стороный, часто удобно представлять иероглиф-фоноидеограмму в виде суммы ключа и фонетика без остатка. Тогда фонетиком будет выступать 胡.
2. Отсутствие фонетика в Юникоде.
Случается, что фонетик представляет из себя набор графем, не совпадающих ни с ключом, ни с каким-либо самостоятельным иероглифом.
Например, фонетиком иероглифа 穀 будет этот же иероглиф за вычетом 禾. Для таких случаев я использую свой кастомный шрифт, в котором создаю нужный знак.
3. Исключения из правила фонетика.
Понятно, что фонетик не определяет чтения всех иероглифов под ним однозначно. Тем не менее, зачастую есть общее правило.
Могут возникать чередования вида lan-nan, qiao-liao и т.п., где финали, как правило подчиняются правилу четче, чем инициали.
Однако часто бывает так, что в ряду чтений фонетика возникает исключение в виде явно выбивающегося чтения, например lan-nan-chi.
Выяснение того, откуда это исключение взялось - тема отдельного исследования.
4. Вариации иероглифов.
И наконец, существование как минимум трех типов начертания иероглифов - китайское традицинное, китайское упрощенное и собственные японские сокращения - также усложняет картину.
Если брать за основу то, что ближе к корням, т.е. китайское традиционное начетание, то это может негативно сказаться на возможности практического применения результатов данного исследования. Если же брать упрощенные начертания, то какие - китайские или японские? Попытка же усидеть на трех стульях может привести к усложнению представления результатов.
В дальнейшем я планирую перенести проект в SQL-базу данных (тем более моя теперешняя работа связана с этим), а в качестве интерфейса использовать Web-приложение на JAVA или Python-скрипт. Но когда это будет - сказать тяжело.
Если говорить о работах на схожую тему, то есть у меня японский словарь фонетиков (см. картинки ниже).
С поправкой на японские варианты начертания некоторых иероглифов, в общем его можно использовать для ознакомления с основныи фонетиками.
Словарь покрывает иероглифы, необходимые для сдачи экзамена 日本漢字能力検定. Это порядка 6000 знаков.
Мое web-приложение можно скачать по ссылке ниже. Архив нужно распаковать и запустить файл home.html.
Практической пользы от текущей версии немного, но с основной идеей ознакомиться можно.
Подводя итог, могу сказать, что особой практической пользы в глубоком изучении фонетиков я не обнаружил.
Если традиционные ключи - это исторически сложившаяся система, то фонетики каждый собирает под свои нужды и в этом смысле исползование чужих наработок особой пользы скорее всего не принесет. Основные фонетики и вариации чтений вы и без этого усвоите в процессе изучения языка. А это скорее форма медитации или даже заболевания.
Fonetics Research