2014.05.13бкрс А как это определить? Да и в ручную глупо делать то, что можно автоматизировать.Определить путем вычитания сомнительных случаев из общей массы.
Объясню мысль.
2014.05.12бкрс Тогда будет делаться так - если скрипт 100% уверен, что апостоф нужен, он добавляется. Если есть какая-то неточность или двусмысленность, то ничего не добавляется, пусть лучше не будет где надо, чем будет ошибочный. В любом случае будет лучше чем никак.Ваш план подразумевает, что проверяться на необходимость постановки апострофа будут все слова, да? Если так, то пусть слова, в которых робот сомневается откладываются в отдельную "кучу" или помечаются как-то в ваших программах (или чем вы там все это автоматизируете). Тогда вы сможете направить редакторов в эту "кучу".
Уж лучше вручную работать там, где робот не тронет, чем оно останется "никаким". Раньше про ручное переделывание традиционных иерогов кто-то тоже мог сказать, что это глупо.
Вообще, мой проект "апострофы вручную" в любом случае пригодится, даже если идеальный алгоритм постановки апострофа и найдется)) Обязательно останутся слова, которые робот обработать нормально не сможет. Те же слова с 儿 требуют работы человеческого мозга.