大家好!
обнаружил интересную статистику, её только пришлось расшифровывать, как думаете верно расшифровал? :
"Первые 58 иероглифов покрывают 50% корпуса текстов, 100 иероглифов - 62,24%. Критический уровень понимания текста 75% достигается 205 иероглифами"
источник:
http://cheloveknauka.com/v/462848/a?#?page=18
http://cheloveknauka.com/problemy-razrabotki-lingv...perevoda-nauchn
Наибольшая частота в исследуемом микрошдъязьке падает га знаки грегмнания (запятую и точку), имекице соответствен!» ранг 1 и 2, которые вместе с именами собственньии и наименованиями орга-шв управления (ранги з-б) составляют 15,762 анализируемого пакета текстов. Первые 58 иероглифов покрывают 50Х корпуса текстов, 100 иероглифов - 62,24*. Критический уровень понимания текста (754)' достигается 205 иероглифами. .795 иероглифов покрывают 95* текстов всех документов. 21словарных величин (40* словаря) покрывают 97* всего цредставлеиюго массива. Редкие иероглифы (с частотой от 1 до 4) составляет 60,09* от объема словаря и покрывает 3,04* корпуса текста.
Диссертации по гуманитарным наукам - http://cheloveknauka.com/problemy-razrabotki-lingv...n#ixzz3rGv3xy4q
обнаружил интересную статистику, её только пришлось расшифровывать, как думаете верно расшифровал? :
"Первые 58 иероглифов покрывают 50% корпуса текстов, 100 иероглифов - 62,24%. Критический уровень понимания текста 75% достигается 205 иероглифами"
источник:
http://cheloveknauka.com/v/462848/a?#?page=18
http://cheloveknauka.com/problemy-razrabotki-lingv...perevoda-nauchn
Наибольшая частота в исследуемом микрошдъязьке падает га знаки грегмнания (запятую и точку), имекице соответствен!» ранг 1 и 2, которые вместе с именами собственньии и наименованиями орга-шв управления (ранги з-б) составляют 15,762 анализируемого пакета текстов. Первые 58 иероглифов покрывают 50Х корпуса текстов, 100 иероглифов - 62,24*. Критический уровень понимания текста (754)' достигается 205 иероглифами. .795 иероглифов покрывают 95* текстов всех документов. 21словарных величин (40* словаря) покрывают 97* всего цредставлеиюго массива. Редкие иероглифы (с частотой от 1 до 4) составляет 60,09* от объема словаря и покрывает 3,04* корпуса текста.
Диссертации по гуманитарным наукам - http://cheloveknauka.com/problemy-razrabotki-lingv...n#ixzz3rGv3xy4q
С уважением,
尤金
--- --- ---
Вы можете стать автором статьи о Китае http://www.kitay-v-mire.com/o-bloge-kitai-v-mire/#avtoram
尤金
--- --- ---
Вы можете стать автором статьи о Китае http://www.kitay-v-mire.com/o-bloge-kitai-v-mire/#avtoram