новый пример
车辆溜放自动调速系统
система автоматического регулирования скоростей скатывания вагонов
12.06
Serge Mileshkin
можно было бы и в основной лексикон, т.к. примеры недоступны в оффлайне. Кстати, выше есть еще два примера, достойные основного словарного состава
12.06
萨沙
дак можно же скачать оффлайн примеры
12.06
Serge Mileshkin
Все правильно, но в корпусе словаря Lingvo их нет
12.06
бкрс
Такое не надо в словарь. Длинное, неустойчивое, никто его по 车辆 искать не будет. Да и вообще такого нет.
Бывает что в примерах проскакивают словарные слова, но этот к ним не относится.

Для таких слов гораздо лучше их наличие в примерах. Так как они будут искаться по всем элементам, как в офлайне, так и онлайне.
Сделать лингво версию примеров элементрано. Не стоит ради офлайна засорять словарь.

Треть слов в словаре нужно или удалить или в примеры отправить. От этого словарь только выиграет.
12.06
李第马
бкрс, а как сделать лингво версию примеров? компилятор не видит этот файл...
12.06
бкрс
Оформить в формате dsl. Заголовок, пробел перед переводом поставить и кодировка.
12.06
李第马
бкрс, пожалуйста, поясните подробнее - я что-то делаю неправильно и компилятор сначала пишет, что не найден файл аннотации, а затем, что нет ни одной успешно скомпилированной карточки
12.06
бкрс
Перед всеми русскими переводами надо поставить пробел регуляркой. Заголовок словаря скопируйте с готового словаря. И сохранить в кодировке UTF16LE+BOM.
12.06
李第马
бкрс, всё получилось, спасибо. остался небольшой вопрос: как автоматически проставить пробел перед каждым руссским переводом?
12.06
李第马
только кодировки UTF16LE+BOM у меня нет, я сохранил в "Юникод".
12.06
бкрс
Как же всё получилось, если ничего не получилось )
Если кодировки нет, установите нормальный текстовый редактор. Notepad++ или подобный. UTF16LE должна быть, BOM это галачка.

Заменять это на это (у второго пробел в начале):
^([^一-鶴])
 \1
12.06
李第马
установил Notepad++, там есть кодировки UTF8 с BOM и без, UTF16LE нет. Еще одна проблема: запустил замену по параметрам "^([^一-鶴])" и " 1", программа не нашла такой текст для замены...
12.06
бкрс
Там оно UCS2LE называется. BOM по умолчанию.
При поиске галочка "Regular Expressions".
И там надо искать ^([^一-鶴\n]) , а то он и в пустых строках пробел ставит.
12.06
李第马
Ура!!!
Добавил в лингво словарь "examples_120602" - отлично работает! Очень полезный словарь, жаль, раньше не мог его добавить...
бкрс, сделал так. В Notepad++ при помощи простого макроса добавил пробелы перед всеми русскими переводами - заняло 3-4 минуты. Пересохранил этот файл через Word в кодировке "Юникод" (видимо, это и есть UTF16LE+BOM. это же обычная двоичная кодировка?). Добавил расширение .dsl, конвертировал через компилятор и добавил в Лингво. Всё готово!
бкрс, большое спасибо за помощь! Может, скопировать эту ветку в форум? Наверное, такие вопросы возникают у многих...
Кстати, поисковую фразу "^([^一-鶴n])" у меня не находит ни в Word, ни в Notepad++. Почему так? Что это за набор символов?
12.06
бкрс
Вы поленились открыть тему для отдельного вопроса и хотите чтобы я сейчас всё копировал, нет уж, пусть тут валяется ) от такого всё равно другим пользы мало

Через ворд делать это извращение. Но раз получилось, то и хорошо.

Там надо было искать с включёнными регулярками галочка "Regular Expressions" при поиске. Всё работает. Если интересно читайте в гугле. Тоже язык, как и китайский, только гораздо проще.
^([^一-鶴\n]) = выбрать первый знак строки где он не иероглиф и не конец строки.
12.06
李第马
Я сам хотел скопировать эту ветку в форум, но если она бесполезная, то не стану. С включенными регулярками поиск заработал. Почему кодировки UTF16LE+BOM не было, так и не понял.
Еще раз спасибо. Надеюсь, что не сильно отвлек своими вопросами.
12.06
бкрс
Я же написал, там эта кодировка UCS2LE называется. Сразу с BOM.
12.06