2014.01.26https://bkrs.info/changes.php?view=core_ch_inzina
несколько минут назад добавила 好借好还 в ядро. В истории правок не отобразился этот переход.
пока там недоработано, поэтому ссылок нет
2014.01.26https://bkrs.info/changes.php?view=core_ch_in пока там недоработано, поэтому ссылок нет 2014.01.26
![]() ![]() 2014.01.26
![]() Ваши два последних 液压手推车 ручная гидравлическая тележка 冲口模 надрезной штамп Точно в ядро не попадут. Из 100 последних новых там всего 2-3 слова можно подумать, остальные это специализированная лексика 2014.01.26
Одно из определений ядра - его невозможно разбить на более простые слова (не путать с иероглифами морфемами) кроме очень устойчивых выражений.
То есть, "载人航天飞船 пилотируемый космический корабль" это не ядро. Специализированно и можно разбить. А 中华人民共和国 это ядро, так как частое и очень устойчивое выражение, хотя и можно разбить. 2014.01.26
![]() 2014.01.26
![]() Но вообще, эта проблема не имеет однозначного решения, как и все другие, это ж лингвистика, а не математика. Многие будут спорны, но спор "нужно ли в ядре" будет гораздо лучше, чем "нужно ли в словаре". Согласен, что нужны общие принципы, без них пока можно опираться лишь на здравый смысл. Но пока ядро и не готово. 2014.01.26
Пока этот вопрос не решен, временно предлагаю все то, что есть в бумажных словарях, считать устоявшимся. Даже если это специализированная лексика. К ним же отнести пословицы, поговорки, недоговорки.
Если это словосочетания, длинные предложения, стихи, крылатые выражения и т.п., относить в примеры к словам или выделять отдельно в раздел "примеры". 2014.01.26
Я предлагаю в качестве ядра выделить все те слова, которые есть в 现代汉语词典, он у нас в сателлитах есть
百花齐放,百家争鸣
2014.01.26
2014.01.26Верно, но с оговоркой "в словарях общей лексики", пусть и сколь угодно больших. В специализированных словарях разброс будет слишком большим, потеряется смысл ядра выделить основные слова. Можно определить ядро через частотность. Чем чаще употребляется слово вообще в среднем, тем больше оно должно быть в ядре. В любом случае, слова вне яра никаким образом не дискриминируются. 2014.01.26
2014.01.26Уже решено Wenlin + все иероглифы. Wenlin там более 200 тысяч, 现代汉语词典 в него точно входит. Для надежности потом можно проверит по нему, чтобы ничего не потерялось. Почему-то сразу не додумался взять готовый словарь. Основную проблему как раз видел в создании ядра. Это ведь надо руками каждое слово чекнуть - слабо представлял, что такое получится. 2014.01.26
|