Сообщения бкрс

1
>>>
остроwok, я искал на локалке, там база месячной давности, 我校 недавно добавлен. Там не обновляется, так что разницы нет. Обновлять в ручную не сложно, можно сделать автообновляемую.

Там немало хороших слов, похоже где-то 2/3, которых стоит добавить.
2019.06.30
Тема Ответить
2
>>>
2019.06.29Рейхсканцлер в базе bkrs сейчас описано 27784 уникальных иероглифов, а в стандарте Unicode прописано аж 89000 (правда, там много неопределенно-азиатского без четких разграничений японских и китайских иероглифов, но все-таки).

Я добавлял все из юнихана у которых есть определение, но в то время нельзя было хранить "тяжёлые" иероглифы (которые в юникоде выходят за рамки 4 знаков) из-за ограничения mysql (старая версия), поэтому очень многие не попали. Сейчас они хранятся в разобраном виде. Типа 𠀾: 𠀾

Хотя видимо что-то почему-то пропустилось. 叞 к таким не относится, но его нет.
2019.06.30
Тема Ответить
3
>>>
остроwok, пока так сделал - https://bkrs.info/tmp/frequency.html (не обновляется)
Интересный список, есть хорошие слова, которые стоит добавить, но приличная часть мусор.

2019.06.29остроwok Раньше у нас было интерактивное "чистилище", интересно было иногда заглянуть, посмотреть, кто чего не нашёл в словаре.
Это и сейчас есть в форме последнего поиска. То, что не находится красным.
2019.06.30
Тема Ответить
4
>>>
2019.06.29остроwok бкрс, а реально неработающие ссылки "в самых частых" сделать красными с подчеркиваниями? Или какой-то список этих частых слов, чтобы добавлять потихоньку.
Гляну насколько сложно. Скорее всего списком, красным затратно, т.к. нужно каждый раз проверять все слова.
Ощущение, что уже это делал. Но наверное проще ещё раз сделать, чем найти.
2019.06.29
Тема Ответить
5
>>>
wusong, проблема в том, что слова нет и его нужно добавить.
Достаточно частое удвоение, странно, что нет.
2019.05.30
Тема Ответить