Страницы (9): 1 2 3 ... 9 Следующая » Переход на страницу 
1
[Изображение: 89.jpg]
Начал делать "ядро" словаря, но пока только зачатки, так как не очень понятно как это лучше использовать и будет ли актуально вообще.

Смысл "ядра" - выделить в 大БКРС часть слов, которые будут словарём в традиционном представлении, там будет большинство это слова (настоящие неделимые) и лишь немного очень устойчивых выражений. Цели выделения ядра три:
1) Наличие качественной мини-версии словаря, это будет актуально на практике в некоторых случаях
2) Концентрация усилий на ядре повысит качество словаря, так как ядро покроет 99% частотности, даже если оно будет менее 1/10 от словаря. Это повлияет на поверку правок, будет достаточно проверить правки "ядра", остальные по возможности.
3) Расширение границ словаря. Благодаря наличию "ядра" будет легче добавлять всё остальное, далеко несловарное, но обладающее устойчивостью.

Но чтобы обладать такой радостью, ядро надо создать и поддерживать, а это немало усилий. Поэтому я не уверен на счёт его жизнеспособности. Единственное, что вселяет оптимизм - ядро достаточно ограничено и не будет сильно меняться после его создания. Словарь 大БКРС теоретически можно развивать бесконечно, а вот ядро нужно лишь один раз создать с определённым количеством слов, а потом лишь изредка добавлять новые, шлифовать старые. Как у настоящих бумажных словарей.

Но тут интересен момент, что даже если ядро не взлетит, цель №3 всё равно реализуется, поэтому затраты на эту возню как минимум окупятся. А если выстрелит, то будет выше ожиданий.


На данный момент сделано:
1. Само понятие ядра появилось в базе словаря.
2. Все слова с 3мя иероглифами с чтением + все иероглифы (у некоторых нет чтения) выделены в ядро. Получилось 266 008 слов.
3. Возможность переключения ядро[Изображение: core.png]/неядро[Изображение: core_not.png] на странице слова. История изменений в правках сохраняется.

Дальше решил пока не продолжать, так как высока вероятность, что будет сделано не то, что надо. Пусть сначала отлежится и осознается в каком ключе это лучше развивать, если вообще стоит.
Как минимум нужно определение какие слова должны быть в ядре.
2014.01.26
Тема Ответить
2
О боже, а ведь можно взять слова того же Вэньлиня, добавить к нему все иероглифы и проблема формирования ядра решенена. Это идеальное решение cute
Сделаю в ближайшее время.
2014.01.26
Тема Ответить
3
А то, что раньше рекомендовали добавлять в примеры, теперь можно будет и в слова добавлять, просто не указывая их как ядро? Имею в виду выражения типа: "назначить экспертизу", "подлежит взысканию", "подводя итоги" и пр.
2014.01.26
Тема Ответить
4
zina, да, по умолчанию всё будет добавляться как "не ядро", поэтому их можно добавлять без каких-либо изменений.
2014.01.26
Тема Ответить
5
А раздел примеры останется или будет упразднен?
2014.01.26
Тема Ответить
6
zina, остануться конечно, как же без них.
Границы словаря расширяются, но не до бесконечности, только для устойчивых и небольших фраз. Всё остальное в примеры.

Примеры это для обычных неустойчивых фраз и законченных предложений. Их как раз гораздо эффективней использовать в примерах, а не словаре.
2014.01.26
Тема Ответить
7
zina, к сожалению, пока точного определения нет. Надеюсь, на подобные вопросы в недалёком будущем ответ будет и будет создана страница в документации.

В общем случае "ядро" это слова неспециализированного бытового языка. Они уже все есть в словаре, если и будут добавляться, то какие-то новые слова, появившиеся последнее время.
То есть, большой активности по добавлению/убиранию из ядра быть не должно. То, что мы сейчас добавляем, это специализированные слова, они не ядрённые.

Про 3 иероглифа ни в коем случае речь не идёт, это я пытался как-то заполнить автоматом. Но уже найдено идеальное решение - сформировать ядро из Вэньлиня.

Все операции с ядром сохраняются в правках, как и операции со словами. За ними точно также можно наблюдать и обсуждать.
2014.01.26
Тема Ответить
8
бкрс, значит, Вы пока даете карт-бланш на занесение любого сочетания в слова. Предвижу хаос.
2014.01.26
Тема Ответить
9
2014.01.26бкрс Все операции с ядром сохраняются в правках, как и операции со словами. За ними точно также можно наблюдать и обсуждать.

несколько минут назад добавила 好借好还 в ядро. В истории правок не отобразился этот переход.
2014.01.26
Тема Ответить
10
2014.01.26zina бкрс, значит, Вы пока даете карт-бланш на занесение любого сочетания в слова. Предвижу хаос.
да ну, большинству это ядро будет по барабану. Оно реально повлияет на тех, кто проверками занимается.
Понятие ядра только в зачаточном состоянии, естественно, принципы пока чётко не сформированы.

А какие вы слова хотите добавить? Если вы про 好借好还, то возможно да. Из ваших последних добавленных, возможно 止息日 и 围框, остальные все специализированные.

Но пока ядро не сформировано, ничего менять не надо, так как оно обнулится. Я в ближайшее время с Веньлиня его сделаю.
Потом надо как-то добавить быструю смену не только на странице слова.
2014.01.26
Тема Ответить
Страницы (9): 1 2 3 ... 9 Следующая » Переход на страницу