бкрс, а реально неработающие ссылки "в самых частых" сделать красными с подчеркиваниями? Или какой-то список этих частых слов, чтобы добавлять потихоньку.
2019.06.29остроwok бкрс, а реально неработающие ссылки "в самых частых" сделать красными с подчеркиваниями? Или какой-то список этих частых слов, чтобы добавлять потихоньку.
Гляну насколько сложно. Скорее всего списком, красным затратно, т.к. нужно каждый раз проверять все слова.
Ощущение, что уже это делал. Но наверное проще ещё раз сделать, чем найти.
2019.06.29остроwok бкрс, а реально неработающие ссылки "в самых частых" сделать красными с подчеркиваниями? Или какой-то список этих частых слов, чтобы добавлять потихоньку.
Кстати, в бкрс есть большое количество иероглифов, которые до сих пор не внесены в словарь. Например такие (контекст не подскажу, отбор делался софтовым методом):
2019.06.29Рейхсканцлер Вообще, если хотите, в бкрс есть большое количество иероглифов и редких слов, которые до сих пор не внесены в словарь. Вот, на вскидку
Меня интересуют именно частые. Жму, когда изучаю иероглиф, и периодически обламываюсь.
А сколько примерно этих редких?
Раньше у нас было интерактивное "чистилище", интересно было иногда заглянуть, посмотреть, кто чего не нашёл в словаре.
2019.06.29остроwok Меня интересуют именно частые. Жму, когда изучаю иероглиф, и периодически обламываюсь. А сколько примерно этих редких?
Если брать те, которые даже в KaiTi - шрифте отсутствуют, то таких просто море (думаю, тысячи). В браузере и документах они будут обычно показываться квадратиками.
Количество таких случаев можно прикинуть: в базе bkrs сейчас описано 27784 уникальных иероглифов, а в стандарте Unicode прописано аж 89000 (правда, там много неопределенно-азиатского без четких разграничений японских и китайских иероглифов, но все-таки).
Но, если брать из стандартного набора упрощенных и традиционных иероглифов, которые, по крайней мере, везде отображаются, то таких немного. Некоторые я и привел.
2019.06.29Рейхсканцлер в базе bkrs сейчас описано 27784 уникальных иероглифов, а в стандарте Unicode прописано аж 89000 (правда, там много неопределенно-азиатского без четких разграничений японских и китайских иероглифов, но все-таки).
Я добавлял все из юнихана у которых есть определение, но в то время нельзя было хранить "тяжёлые" иероглифы (которые в юникоде выходят за рамки 4 знаков) из-за ограничения mysql (старая версия), поэтому очень многие не попали. Сейчас они хранятся в разобраном виде. Типа 𠀾: 𠀾
Хотя видимо что-то почему-то пропустилось. 叞 к таким не относится, но его нет.