1
Не знаю - проблема это, или нет, но решил зафиксировать.

Смотрю слово 认真. Там есть такое:

Цитата:частотность: #721
в самых частых:
认认真真

Причём 认认真真 - гиперссылка.

Тыкаюсь на 认认真真 - и получаю:

Цитата:认认真真
такого слова нет, добавить
2019.05.29
ЛС Ответить
2
wusong, проблема в том, что слова нет и его нужно добавить.
Достаточно частое удвоение, странно, что нет.
2019.05.30
ЛС Ответить
3
бкрс, а реально неработающие ссылки "в самых частых" сделать красными с подчеркиваниями? Или какой-то список этих частых слов, чтобы добавлять потихоньку.
2019.06.29
ЛС Ответить
4
2019.06.29остроwok бкрс, а реально неработающие ссылки "в самых частых" сделать красными с подчеркиваниями? Или какой-то список этих частых слов, чтобы добавлять потихоньку.
Гляну насколько сложно. Скорее всего списком, красным затратно, т.к. нужно каждый раз проверять все слова.
Ощущение, что уже это делал. Но наверное проще ещё раз сделать, чем найти.
2019.06.29
ЛС Ответить
5
2019.06.29остроwok бкрс, а реально неработающие ссылки "в самых частых" сделать красными с подчеркиваниями? Или какой-то список этих частых слов, чтобы добавлять потихоньку.

Кстати, в бкрс есть большое количество иероглифов, которые до сих пор не внесены в словарь. Например такие (контекст не подскажу, отбор делался софтовым методом):

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21. 坖坘
22.
23.
24.
25.
26.
27.
28.
29.
30. 壥壦
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41. 婱婲
42.
43.
44.
45.
46.
47.
48.
49. 孞孠孠孡
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63. 櫣櫤
64.

Если кто-то сталкивался и знает перевод чего-либо из этого, можно внести в словарь.
2019.06.29
ЛС Ответить
6
2019.06.29Рейхсканцлер Вообще, если хотите, в бкрс есть большое количество иероглифов и редких слов, которые до сих пор не внесены в словарь. Вот, на вскидку

Меня интересуют именно частые. Жму, когда изучаю иероглиф, и периодически обламываюсь.
А сколько примерно этих редких?
Раньше у нас было интерактивное "чистилище", интересно было иногда заглянуть, посмотреть, кто чего не нашёл в словаре.
2019.06.29
ЛС Ответить
7
2019.06.29остроwok Меня интересуют именно частые. Жму, когда изучаю иероглиф, и периодически обламываюсь.  А сколько примерно этих редких?  

Если брать те, которые даже в KaiTi - шрифте отсутствуют, то таких просто море (думаю, тысячи). В браузере и документах они будут обычно показываться квадратиками.
Количество таких случаев можно прикинуть: в базе bkrs сейчас описано 27784 уникальных иероглифов, а в стандарте Unicode прописано аж 89000 (правда, там много неопределенно-азиатского без четких разграничений японских и китайских иероглифов, но все-таки).

Но, если брать из стандартного набора упрощенных и традиционных иероглифов, которые, по крайней мере, везде отображаются, то таких немного. Некоторые я и привел.
2019.06.29
ЛС Ответить
8
остроwok, пока так сделал - https://bkrs.info/tmp/frequency.html (не обновляется)
Интересный список, есть хорошие слова, которые стоит добавить, но приличная часть мусор.

2019.06.29остроwok Раньше у нас было интерактивное "чистилище", интересно было иногда заглянуть, посмотреть, кто чего не нашёл в словаре.
Это и сейчас есть в форме последнего поиска. То, что не находится красным.
2019.06.30
ЛС Ответить
9
2019.06.29Рейхсканцлер в базе bkrs сейчас описано 27784 уникальных иероглифов, а в стандарте Unicode прописано аж 89000 (правда, там много неопределенно-азиатского без четких разграничений японских и китайских иероглифов, но все-таки).

Я добавлял все из юнихана у которых есть определение, но в то время нельзя было хранить "тяжёлые" иероглифы (которые в юникоде выходят за рамки 4 знаков) из-за ограничения mysql (старая версия), поэтому очень многие не попали. Сейчас они хранятся в разобраном виде. Типа 𠀾: 𠀾

Хотя видимо что-то почему-то пропустилось. 叞 к таким не относится, но его нет.
2019.06.30
ЛС Ответить
10
2019.06.30бкрс Интересный список, есть хорошие слова, которые стоит добавить, но приличная часть мусор.

Почему-то там есть существующие слова, например, 我校
2019.06.30
ЛС Ответить