подскажите где есть в интернете корпус китайского языка
чтобы можно было искать по газетам, публикациям употребления словосочетаний и т.д
чтобы можно было искать по газетам, публикациям употребления словосочетаний и т.д
подскажите где есть в интернете корпус китайского языка
чтобы можно было искать по газетам, публикациям употребления словосочетаний и т.д 2024.06.27
Пошерстите форум, тут проходил сборник самой употребительной лексики блогосферы и т.д. (20000 слов и выражений).
2024.06.28
TEST1, Это не то, о чем спрашивает джентльмен выше. Это не частотный словарь или что-то иное, а скорее банк текстов. И уж тем более 20 тыс.лексических единиц - это не тот объем.
Вот, например, "корпус русского языка". https://ruscorpora.ru/ - 2 млрд. слов. Очевидно, человек ищет что-то аналогичное на китайском. 2024.06.28
2024.06.27anatoli подскажите где есть в интернете корпус китайского языка Наверное, стОит здесь в одном месте собрать все ссылки на китайкие лингвокорпуса. Начну такой список: 1. Русско-китайский параллельный подкорпус НКРЯ 2. BCC语料库 (北京语言大学语言智能研究院) 3. Sinica Corpus (中央研究院現代漢語標記語料庫) 4. CCL语料库(北京大学中国语言学研究中心) 5. 中国特色话语对外翻译标准化术语库(中国翻译研究院) 6. 中国重要政治词汇对外翻译标准化专题库(中国翻译研究院) 7. 媒体语言语料库(国家语言资源监测与研究有声媒体中心) 8. NCCU Corpus(政治大學中文口語語料庫) 9. YouGlish.com (Chinese) 10. 人民日报图文数据库(1946-至今) 11. Newspaper SG 12. 俄汉翻译语料库检索系统 13. Internet Archive 14. 中文马克思主义文库搜索 Также можно превратить поисковик Google в настоящий лингвокорпус и искать по текстам печатных и авторитетных электронных изданий (далее ссылки на примере поиска по слову "北京"). Прежде всего используем сервисы самого Google: 15. Google News 16. Google Books Затем можно поискать на отдельных заслуживающих доверия инфоресурсах. Формат поиска в Google: "искомое слово" site:ссылка на ресурс, по которому ведётся поиск Рекомендую такие полезные ресурсы: 17. 人民日报 - 人民日报1946-2003 - 老资料网 18. 國語日報 Буду признателен, если кто-то дополнит этот список ещё чем-нибудь полезным и поделится своими ноу-хау по добыче информации в Интернете.
Телеграм-канал "Китайский для каждого".
2024.06.29
2024.06.29Сат Абхава Наверное, стОит здесь в одном месте собрать все ссылки на китайкие лингвокорпуса. Начну такой список: Спасибо, даже переслала себе, чтобы не потерять 2024.06.29
2024.06.2888775 TEST1, Это не то, о чем спрашивает джентльмен выше. Это не частотный словарь или что-то иное, а скорее банк текстов. И уж тем более 20 тыс.лексических единиц - это не тот объем. Частный случай. Частотный список самых употребляемых 20 тыс. слов, в китайских микроблогах, состоящих из 2-х и 3-х иероглифов. Список взят из более расширенного списка, составленного в Пекинском языковом университете (北京语言大学, Beijing Language and Culture University), содержащего свыше 5 млн. записей. Из данного списка отобраны первые 20 тыс. слов по индексу частотности, исключены одноиероглифовые слова (морфемы), также исключены слова, состоящие из 4 и более иероглифов. 2024.06.29
|