В Юникоде есть ряд знаков, что являются дупликатами уже распространённых знаков и включены только для совместимости. Похоже, что они по большей части используются в корейских текстах. Возможно, что корейские IME до сих пор их используют. Тем не менее, "Unicode Compatibility Characters are deprecated, and their use is discouraged."
Например, 老 = 老.
Т.к. БКРС теперь в себя включает базу Unihan, неплохо бы сделать ссылки с этих дупликатов на общеупотребимые варианты. Вручную это делать тяжело, неплохо бы если бы Вы автоматизитировали процесс.
Вот полный список.
Например, 老 = 老.
Т.к. БКРС теперь в себя включает базу Unihan, неплохо бы сделать ссылки с этих дупликатов на общеупотребимые варианты. Вручную это делать тяжело, неплохо бы если бы Вы автоматизитировали процесс.
Вот полный список.