11
Сат Абхава Пришла в голову такая шальная идея (насколько она может быть интересной и осуществимой - не знаю). В сети можно свободно найти оригинальные русскоязычные тексты с качественными переводами на китайский язык. Например, полное собрание сочинений Ленина и Сталина, переводы русской классики и т.п. И вот подумалось: насколько это было бы интересным и техническим возможным на базе 大БКРС создать лингвокорпус параллельных русских текстов и их китайских переводов? Это дало бы огромный качественный материал для анализа. Уж китайские переводы Ленина и Сталина "вылизаны" так, что их можно разучивать и распевать как мантры на ночь для трансцендентного выхода из тела и полётов в снах! 29 Если такая идея интересна, то можно продолжить обсуждение.

Вы, верно, знаете об этом ресурсе?
https://linghub.ru/rnc_parallel_chinese/search
ЛС Ответить
12
Сат Абхава В том виде, в каком это сейчас работает в базе примеров, для лингвокорпуса не пойдёт. Там нет даже базового функционала.  

Тогда что вы под лингвокорпусом понимаете, какой функционал нужен?
ЛС Ответить
13
Небожительница Вы, верно, знаете об этом ресурсе?
https://linghub.ru/rnc_parallel_chinese/search
Этот ресурс является одной из составляющих проекта "Русско-китайский параллельный корпус НКРЯ" : см. страницу https://ruzhcorp.ruscorpora.ru/

На упомянутой странице указано:
Цитата:Немного истории
Наш корпус появился внутри НКРЯ в 2016 году. С 2019 года он доступен на двух страницах:

на сайте Национального корпуса русского языка (общий для НКРЯ интерфейс, более редкое добавление текстов),
на сайте корпусных проектов НИУ ВШЭ (экспериментальный интерфейс, более оперативное добавление текстов).
Т.е., приведённая вами ссылка является второй в перечне НКРЯ (как проект НИУ ВШЭ).
Да будь я хоть негром преклонных годов, живи хоть в Москве, хоть в Бильбао -
Китайский я б выучил только за то, что им разговаривал Мао!
(иностранный язык зайдёт навсегда https://dzen.ru/zapomnim3000/)
ЛС Ответить
14
Небожительница Вы, верно, знаете об этом ресурсе?
https://linghub.ru/rnc_parallel_chinese/search

Да, я как-то пробовал им пользоваться, но почему-то он меня не впечатлил. Может, я в нем пока не очень хорошо разобрался. Надо поюзать его тщательнее.
Телеграм-канал "Китайский для каждого".
ЛС Ответить
15
Boyar Этот ресурс является одной из составляющих проекта "Русско-китайский параллельный корпус НКРЯ" : см. страницу https://ruzhcorp.ruscorpora.ru/

На упомянутой странице указано:
Т.е., приведённая вами ссылка является второй в перечне НКРЯ (как проект НИУ ВШЭ).

Спасибо! Это интересно! Поизучаю...

Оказывается, там есть ссылка на пекинский китайско-русский корпус: http://rucorpus.cn/ - стоит обратить внимание!
Телеграм-канал "Китайский для каждого".
ЛС Ответить
16
бкрс Тогда что вы под лингвокорпусом понимаете, какой функционал нужен?

Собственно, те же базовые поисковые функции, которыми обычно снабжены лингвокорпуса. Например, хотелось бы, чтобы можно было искать как по точному соответствию (например, только по части слова), так и по слову во всех грамматических формах. Также нужен поиск по нескольким словам сразу (т.е. как словосочетание - с настраиваемым интервалом между словами). Возможность выхода через результат поиска на более обширный контекст для детального изучения. Как-то так.
Телеграм-канал "Китайский для каждого".
ЛС Ответить
17
Сат Абхава Поскольку это переводы, то строчка к строчке вряд ли будет попадать. А вот абзац к абзацу вполне попадёт.

абзац к абзацу сделал у себя на сайте, при этом есть перевод отдельных китайских слов по клику. Это, конечно, не лингвокорпус, но старался сделать параллельное чтение удобным. База слов как раз отсюда с БКРС (там есть мизер отредактированных и новых слов, но этим можно пренебречь, учитывая кол-во). Тексты добавляют сами пользователи

В остальном с поиском по предложению не заморачивался, и большие тексты на нем пока не опубликовать.

Я хотел добавить возможность публиковать книги, однако пока руки не дошли. Плюс там реально нужно заморочиться с разбиением на параграфы (не говоря уже о предложениях), так как зачастую в переводах что-то опускается, 2 параграфа переводятся в один вперемешку и наоборот. В общем не все так просто
ChinesePlus.club все могут делиться текстами и видео на китайском
ЛС Ответить
18
https://ruzhcorp.ruscorpora.ru/

Первое впечатление от этого корпуса крайне положительное!
Телеграм-канал "Китайский для каждого".
ЛС Ответить
19
Сат Абхава Так подготовить файлы с параллельными текстами, разбитыми на абзацы, - это не самое сложное дело.

не соглашусь, это довольно трудоемкое занятие, а для китайского усложняется еще сегментацией слов, так как нет пробелов.
С сегментацией еще можно как-то покрутить алгоритмически, а вот разбить две текста (русский и китайский) на соответствующие параграфы - это уже довольно трудно.


Сат Абхава А вот под такой лингвокорпус движок нормальный создать - это похитрей задачка будет!

эта задачка все-таки реальнее, чем подготовить большие объемы текстов и книг, разбитых на параллельные параграфы. Ну или я просто мест таких не знаю в интернете.

PS: Вы уже у нас постили на сайте, сразу не признал)
ChinesePlus.club все могут делиться текстами и видео на китайском
ЛС Ответить
20
Сат Абхава https://ruzhcorp.ruscorpora.ru/

Первое впечатление от этого корпуса крайне положительное!

Поддерживаю! Нормальная тема!
ЛС Ответить