1
Добавлен сателлит из всех иероглифов.

Подробней здесь - https://bkrs.info/taolun/thread-162.html

25868 всего иероглифов
из них
3008 без пиньиня
5583 без перевода


Из них 13610 новых иероглифов добавлены в 大БКРС. Полный список новых иероглифов - https://bkrs.info/tmp/sat4.txt (файрфокс все отображает).

У которых нет чтения проставлено "-", то же с отсутствующим переводом "-".
Причем если их нет, их действительно нет. zdic.net смотреть бесполезно.

Все ссылки (типа "same as [ref]檰[/ref]") проставлены автоматически, т.е. руками ничего править не придется.

Иероглифы у которых юникод пятизначный не добавлены, так как настоящая версия база данных их не поддерживает. Но следующая версия будет. Возможно, они будут добавлены в офлайн версию.
В любом случае они крайне редки и у подавляющего большинства нет перевода. Всего пятизначных 14 571.
2010.05.19
Ответить
2
Заметил, что последний из добавленный иероглифов это 鶴.

В регулярных выражения, когда надо выбрать иероглиф пишут [一-鶴], то есть, знак от 一 до 鶴.

Это означает, что пятизначные иероглифы, которые идут сразу после 鶴, даже регулярками не возьмешь. То есть, может и возьмешь если заменишь 鶴 на более поздний, но обычно пишут именно 鶴.
2010.05.19
Ответить
3
Смотрю, IgorF 夶 добавил. Типа назло Smile

Да, небольшой дефект при выборке.
У него не было ни значения ни пиньиня (нормального)
kJapaneseKun KURAABERU
kJapaneseOn HI
kMandarin BI3

Видимо, некоторые иероглифы все-таки потерялись, не все так идеально.

Но не так сложно добавить все иероглифы, а не только китайские. Чтобы уж точно все китайские попали.
Может так и сделаю. Я просто побоялся, что там какие-то вьетнамские и т.п., но сейчас глянул - тоже нормальные иероглифы.
Например, вот - http://bbs.zdic.net/thread-53449-1-1.html . Просто у него из информации только чтение ngóm . И всё. Хотя он пятизначный, все равно в базу не войдет.
2010.05.19
Ответить