<<< 1 2 3 4 ... 8 >>> Переход на страницу  + 🔎
21
2018.02.03Рейхсканцлер Итак. Я выложил русский и китайский текст довольно известного романа Марселя Пруста "В поисках утраченного времени" (追忆似水年华). Текст вполне образцовый как по используемой лексике (не самая бытовая), так и по объему. Скачать можно тут.

Если у кого есть нужный для этого софт, было бы интересно узнать
1) сколько уникальных иероглифов встречается в китайском тексте
2) какой словарный запас русского текста
3) какой словарный запас китайского текста

Upd: 1,2 посчитал.
1) Уникальных иероглифов 4568 (включая знаки препинания). Использован этот софт. Из этого уже следует, что китаец, знающий только 4000 иероглифов, не сможет физически прочитать этот роман даже на китайском.
2) Уникальных слов русского языка 101403. Использован этот софт.

Подсчёт уникальных русских слов вёлся с учётом изменений по падежам, временам, числам?
2018.02.04
Ответить
22
2018.02.04Ызаб Подсчёт уникальных русских слов вёлся с учётом изменений по падежам, временам, числам?

Нет, такого софта я не нашел, а самому писать долго. У кого есть под рукой, может сам попробовать, по ссылке выше есть текстовый файл с русским текстом.
2018.02.04
ЛС Ответить
23
2018.02.03Ветер 在汉语中,字和词不是同一个概念。
字是单个的汉字;
词是由语素构成的能独立充当句子成分的最小的语法单位。单音节词,写出来就是一个汉字,双音节词写出来是两个汉字。字和词明显不同,但有重叠的情况。
字词,是字和词的合成。
词语,包括词和短语。
Я не понимаю "слово" это переводит с русского на китайский как будет, слово это 字 или 词?
если слово это 词 т.е
китайское слово 天 это 词
русское слово небо 俄语单词, английское слово sky это 英语单词
небо=sky=天 т.е 单词=词?
а как же 单词 на китайском языке будет? или в китайском языке нет такого понятия 单词,это 单词( слово, word) только относится к европейским языкам, в китайском языке только 词(词汇) который может создать из одного иероглифа и также может создать из двух, трех иероглифов. это так ли?   если так, то 天 он является 字 или 词?или он и то и другой.
词 (汉语词汇) 编辑 https://baike.baidu.com/item/词/723530?fr=aladdin
词是最小的能够独立运用的语言单位。同时,词也是一种诗的别体,萌芽于南朝,是隋唐时兴起的一种新的文学样式。天,人,牛,马,冷,热,大,小,高,矮.... 都是可以独立运用的语言单位,它们到底是字还是词? 或者可以说它们既是字又是词
2018.02.04
ЛС Ответить
24
Взмах, слово 词/单词 (это одно и тоже)
иероглиф 字/汉字
2018.02.04
ЛС Ответить
25
2018.02.03Рейхсканцлер Итак. Я выложил русский и китайский текст довольно известного романа Марселя Пруста "В поисках утраченного времени" (追忆似水年华). Текст вполне образцовый как по используемой лексике (не самая бытовая), так и по объему. Скачать можно тут.

Если у кого есть нужный для этого софт, было бы интересно узнать
1) сколько уникальных иероглифов встречается в китайском тексте
2) какой словарный запас русского текста
3) какой словарный запас китайского текста

Upd: 1,2 посчитал.
1) Уникальных иероглифов 4568 (включая знаки препинания). Использован этот софт. Из этого уже следует, что китаец, знающий только 4000 иероглифов, не сможет физически прочитать этот роман даже на китайском.
2) Уникальных слов русского языка 101403. Использован этот софт.
так нельзя сравнить, потому у каждого китайского иероглифа имеет свое значение а когда два иероглифы присоединяется выходит новое значение, хоть при присоединении иероглифы не меняется но смысл уже меняется. например 美 красота, 女 женщина  美女 это уже красавица. в русском языке для каждого конкретного предмета закреплен за ними отдельное слово, а в китайском языке это как комбинаторика из базовых иероглифов создает новую комбинацию для новых слов. поэтому нельзя так тупо сравнить двух языков через эту программу.
2018.02.04
ЛС Ответить
26
2018.02.04Ветер Взмах, слово 词/单词 (это одно и тоже)
иероглиф 字/汉字
ок, допустим слово это 词/单词 (это одно и тоже)
天,苍天,蓝天,阴天,晴天 это все 词
а если переводим 蓝天 на русский или на английский это уже не 单词
Голубое небо 蓝天 на русском языке это слово? я читаю что это предложение
а вот небо=天 если он как слово词/单词, но 天 в свою очередь это 字 который сам по себе имеет свое значение, поэтому я путаю между 字и 词, или такие иероглифы как 天 имеет двойную характеристику, они 字/词/单词
2018.02.04
ЛС Ответить
27
Поэтому я думаю что нужно четное определение завести для какого случая, слово это 字 а 词 это лексика, а не как сейчас понятие слова смутное для китайского языка, слово может быть 字 и может быть 词, вот пример 天
2018.02.04
ЛС Ответить
28
Взмах, не четкое это определение только у вас в голове =)
слово не может переводиться как 字 14
комбинаторика в кит языке есть, но она не безграничная, есть куча устойчивых слов. как и в русском, приставки можно гипотетически как угодно комбинировать, но устойчивые слова все же есть.

проблема соответствия слов в одном языке другому - это уже вопрос перевода.
русское увидел/видел
看+到了
看了
看过
превращается в китайское слово+что-то еще, или даже два слова.
2018.02.04
ЛС Ответить
29
2018.02.04Ветер Взмах, не четкое это определение только у вас в голове =)
слово не может переводиться как 字 14
разве? далеко ходить ненадо, тут в бкрс напишите иероглиф 天 посмотрите перевод на русском языке как будет. 天=небо, если по вашему слово не может переводиться как 字, то тут какая ошибка, либо небо не слово либо 天 не 字, а 天 неужели не 字 (иероглиф) а небо не слово? почему такой равенственный перевод выходит,как этого объяснить?
2018.02.04
ЛС Ответить
30
Иероглиф ~= морфема.
Слово запросто может состоять из одной морфемы.
Мост, лёг, в - все эти слова состоят из одной морфемы. Отсюда НЕ следует, что морфема = слово.
Последнее из приведенных слов состоит даже из одной буквы. Не будете же вы на основании этого говорить о неопределенности границ между словом и буквой.
2018.02.04
ЛС Ответить
<<< 1 2 3 4 ... 8 >>> Переход на страницу  + 🔎