+  i  
1
подскажите где есть в интернете корпус китайского языка
чтобы можно было искать по газетам, публикациям употребления словосочетаний и т.д
2024.06.27
ЛС Ответить
2
Пошерстите форум, тут проходил сборник самой употребительной лексики блогосферы и т.д. (20000 слов и выражений).
2024.06.28
ЛС Ответить
3
TEST1, Это не то, о чем спрашивает джентльмен выше. Это не частотный словарь или что-то иное, а скорее банк текстов. И уж тем более 20 тыс.лексических единиц - это не тот объем.
Вот, например, "корпус русского языка". https://ruscorpora.ru/ - 2 млрд. слов. Очевидно, человек ищет что-то аналогичное на китайском.
2024.06.28
ЛС Ответить
4
https://bcc.blcu.edu.cn/
2024.06.28
ЛС Ответить
5
2024.06.28DP https://bcc.blcu.edu.cn/

Интересный ресурс, там даже есть HSK常用词例句
2024.06.29
ЛС Ответить
6
2024.06.27anatoli подскажите где есть в интернете корпус китайского языка
чтобы можно было искать по газетам, публикациям употребления словосочетаний и т.д

Наверное, стОит здесь в одном месте собрать все ссылки на китайкие лингвокорпуса. Начну такой список:

1. Русско-китайский параллельный подкорпус НКРЯ
2. BCC语料库 (北京语言大学语言智能研究院)
3. Sinica Corpus (中央研究院現代漢語標記語料庫)
4. CCL语料库(北京大学中国语言学研究中心)
5. 中国特色话语对外翻译标准化术语库(中国翻译研究院)
6. 中国重要政治词汇对外翻译标准化专题库(中国翻译研究院)
7. 媒体语言语料库(国家语言资源监测与研究有声媒体中心)
8. NCCU Corpus(政治大學中文口語語料庫)
9. YouGlish.com (Chinese)
10. 人民日报图文数据库(1946-至今)
11. Newspaper SG
12. 俄汉翻译语料库检索系统
13. Internet Archive
14. 中文马克思主义文库搜索

Также можно превратить поисковик Google в настоящий лингвокорпус и искать по текстам печатных и авторитетных электронных изданий (далее ссылки на примере поиска по слову "北京").
Прежде всего используем сервисы самого Google:

15. Google News
16. Google Books

Затем можно поискать на отдельных заслуживающих доверия инфоресурсах. Формат поиска в Google: "искомое слово" site:ссылка на ресурс, по которому ведётся поиск
Рекомендую такие полезные ресурсы:

17. 人民日报 - 人民日报1946-2003 - 老资料网
18. 國語日報

Буду признателен, если кто-то дополнит этот список ещё чем-нибудь полезным и поделится своими ноу-хау по добыче информации в Интернете.
Телеграм-канал "Китайский для каждого".
2024.06.29
ЛС Ответить
7
2024.06.29Сат Абхава Наверное, стОит здесь в одном месте собрать все ссылки на китайкие лингвокорпуса. Начну такой список:

1. Русско-китайский параллельный подкорпус НКРЯ
2. BCC语料库 (北京语言大学语言智能研究院)
3. Sinica Corpus (中央研究院現代漢語標記語料庫)
4. CCL语料库(北京大学中国语言学研究中心)
5. 中国特色话语对外翻译标准化术语库(中国翻译研究院)
6. 中国重要政治词汇对外翻译标准化专题库(中国翻译研究院)
7. 媒体语言语料库(国家语言资源监测与研究有声媒体中心)
8. NCCU Corpus(政治大學中文口語語料庫)
9. YouGlish.com (Chinese)
10. 人民日报图文数据库(1946-至今)
11. Newspaper SG
12. 俄汉翻译语料库检索系统
13. Internet Archive
14. 中文马克思主义文库搜索

Также можно превратить поисковик Google в настоящий лингвокорпус и искать по текстам печатных и авторитетных электронных изданий (далее ссылки на примере поиска по слову "北京").
Прежде всего используем сервисы самого Google:

15. Google News
16. Google Books

Затем можно поискать на отдельных заслуживающих доверия инфоресурсах. Формат поиска в Google: "искомое слово" site:ссылка на ресурс, по которому ведётся поиск
Рекомендую такие полезные ресурсы:

17. 人民日报 - 人民日报1946-2003 - 老资料网
18. 國語日報

Буду признателен, если кто-то дополнит этот список ещё чем-нибудь полезным и поделится своими ноу-хау по добыче информации в Интернете.

Спасибо, даже переслала себе, чтобы не потерять
2024.06.29
ЛС Ответить
8
2024.06.2888775 TEST1, Это не то, о чем спрашивает джентльмен выше. Это не частотный словарь или что-то иное, а скорее банк текстов. И уж тем более 20 тыс.лексических единиц - это не тот объем.
Вот, например, "корпус русского языка". https://ruscorpora.ru/ - 2 млрд. слов. Очевидно, человек ищет что-то аналогичное на китайском.

Частный случай.

Частотный список самых употребляемых 20 тыс. слов, в китайских микроблогах, состоящих из 2-х и 3-х иероглифов. Список взят из более расширенного списка, составленного в Пекинском языковом университете (北京语言大学, Beijing Language and Culture University), содержащего свыше 5 млн. записей. Из данного списка отобраны первые 20 тыс. слов по индексу частотности, исключены одноиероглифовые слова (морфемы), также исключены слова, состоящие из 4 и более иероглифов.
2024.06.29
ЛС Ответить
+  i