Страницы (9): « Предыдущая 1 2 3 4 ... 9 Следующая » Переход на страницу 
21
2014.01.26бкрс В любом случае, слова вне яра никаким образом не дискриминируются.

Если смысл только в оранжевом кружочке, зачем тогда ядро? Какую полезную функию оно выполняет?

Остается последний критерий: количество иероглифов в слове.
2014.01.26
Ответить
22
zina, я в первом посте написал функции:
1) повышения качества словаря путём конценртацией внимания на более частых словах, очень актуально для проверок. Качество словаря будет определятся качеством ядра, а не только количеством слов.
2) обоснованность добавления "не слов"
+ возможность создавать 小БКРС (核БКРС), в некоторых местах может пригодится.

Тут всё просто - ресурсов мало, слов много. Поэтому надо выделить слова, к которым пойдут ресурсы, если на всех не хватает. И не будет психологических проблем добавлять всё остальное.

2014.01.26zina Остается последний критерий: количество иероглифов в слове.
Да, чем меньше иероглифов, тем скорее слово будет в ядре, но не обязательно. В первую очерь кандидатами следует рассматривать слова из 2х иероглифов.
Например: "橇装 смонтированный на полозьях" - не очень для ядра.
2014.01.26
Ответить
23
Или возможно сгруппировать слова по совпадению последовательности иероглифов. Как это уже имеется в функции "слова начинающиеся с". Задать им порядок вывода каждого последующего иероглифа в соответствии с пиньинем. Тогда будет легче редактировать, опираясь на исходное более короткое слово.
2014.01.26
Ответить
24
200 000 слов для "ядра" это чересчур много, по-моему. Это уже не ядро, а ядрище какое-то. Я открываю словарь Даля на 200 000 слов и там на каждой странице куча незнакомых слов. В китайском я думаю будет примерно так же. В 现代汉语词典 отражено примерно 60-70 тысяч слов, что и можно считать ядром - в самом словаре пишется, что они в целом отразили современное развитие путунхуа. 基本上反映了目前现代汉语词汇的面貌, 能够满足广大读者查考的需要
При этом словарь предполагается использовать как справочное пособие для чтения, что говорит о том, что там так же отображены и не самые часто употребляемые слова.

http://slovar-dalja.ru/letter/12/0 посчитайте количество слов, которые Вы не знаете или плохо понимаете... Это 200 000 слов. Куда такое ядрище?
百花齐放,百家争鸣
2014.01.26
Ответить
25
Ветер, согласен, что много, я отфильтрую по наличию пиньиня. Это существенно уменьшит объём и отбросит шлак.

Но не забывайте, что одних иероглифов будет под 80 000 (или сколько там). Если без учёта иероглифов, то хотелось бы уместиться в 100 000.

В любом случае, легче убирать лишнее, чем добавлять недостающее. Лучше, чтобы было чуть больше, чем чуть меньше.
2014.01.26
Ответить
26
Ветер, с русским сравнивать нельзя. В китайском не такое строгое деление на слова. Слово это и 吃 и 饭 и 吃饭, в русском подобного нет.

Ядро же будет не "для начинающих", а самое настоящее ядро лексики китайского языка + все иероглифы.
2014.01.26
Ответить
27
Цифра в 60-70 тысяч наиболее оптимальна. Словарь Ожегова содержит примерно 70 тысяч слов, но незнакомых я почти не встречаю, есть и группа тех, в которых не очень уверен - например "службист". Хотя 100 000 в целом тоже подойдёт, но компактностью тут уже и не пахнет.
2014.01.26
Ответить
28
В русском зато куча суффиксов, которые могут от одного корня образовать кучу слов, что в китайском невозможно. Это несколько завышает кол-во слов, но учитывая особенность китайского, которая тоже завышает - получается примерно одинаково.

Слон. Слоновый. Слоновидный. Слоновой. Слоновистый. Слоновий. Слонявый. Слоноподобный. Слоновский. Слонский. Слонёный. Итд.

В словарь, как и в китайском, идут только самые устойчивые.
2014.01.26
Ответить
29
Войдет ли ядро в ядро?

Интересно все-таки какой объем специализированной лексики войдет в ядро?
На картинке, которая начинает тему, изображены 地球,地壳, 地幔, 地核 (земное ядро), причем можно различить даже 上地幔, 下地幔, 外地核, 内地核 и 莫荷界面. Войдут ли эти слова в ядро?
В геологии если провести очень жесткий отбор необходимый минимум будет включать тысяч пять минимум (минералы, породы, стратиграфия, структуры и пр. и пр.).
В любой специальной области найдется несколько тысяч базовых терминов, если пройтись по всем несколько десятков тысяч легко найдется.
2014.01.26
Ответить
30
2014.01.26Geologist 地球,地壳, 地幔, 地核
Эти определённо да.

2014.01.26Geologist 上地幔, 下地幔, 外地核, 内地核 и 莫荷界面.
Эти нет. Это уже специализированные словосочетанияж.

Цитата:В геологии если провести очень жесткий отбор необходимый минимум будет включать тысяч пять минимум (минералы, породы, стратиграфия, структуры и пр. и пр.).
Обычные слова должны войти - минералы, породы. Те, что нужны для переводов обычных, неузкоспециализированных текстов.
Школьный учбеник по геологии с этим ядром можно прочитать, разве что некоторые словосочетания не войдут.


Не забывайте, что ядро это не словарь. Сильным 大БКРС как раз делает наличие узкоспециализированных слов, которых крайне сложно переводить только используя ядро.
2014.01.26
Ответить
Страницы (9): « Предыдущая 1 2 3 4 ... 9 Следующая » Переход на страницу