Сообщения Opiate

1
>>>
hgw196,
у меня хорошие учебные словари для старых стандартов
сам чск меня не интересует
но какие-то основы лексики хорошо повторять, чтобы не забывать язык
Think for yourself, question authority
2022.02.09
Тема Ответить
2
>>>
snum23,
да, работает, спасибо  56
я список слов для старого чск решил подготовить на карточки, скобки удалить, традиционные иероглифы по возможности

бкрс,
я даже написал решение
но слишком громоздкое 118
завтра покопаюсь, как можно сделать простым удалением по списку
2022.02.07
Тема Ответить
3
>>>
test4,
я по юникоду сделаю, а его потом в иероглифы и латницу конвертну
завтра подумаю, как отфильтровать/отсортировать
пока что у меня оба массива вот так выглядят



2022.02.07
Тема Ответить
4
>>>
test4,
да, конвертеры различные онлайн есть
у меня несколько иная задача - просто по возможности убрать традиционные иероглифы из текста

пока я нашел список 8300 традиционных иероглифов cj5-8300 для 倉頡
убрал все кроме иероглифов, сконвертировал в массив юникод-значений
изначальный текст тоже переконвертировал в массив юникод-значений
теперь надо один массив отсортировать по второму и выкинуть ненужное

но, может, есть что-то попроще?
2022.02.07
Тема Ответить
5
>>>
Насколько я понял, в юникоде нет отдельных диапазонов для упрощенных и традиционных иероглифов
Существует ли регулярное выражение, позволяющее убрать из текста традиционные иероглифы? или как это можно сделать иным способом?
2022.02.07
Тема Ответить