Сообщения бкрс

1
>>>
Зато сколько нового узнали.


Скрипт добавления традиционных заголовков в 大БКРС - add_traditional.py

Процесс тот же. Скачать и установить питон (если нет). В папку к скрипту положить файл словаря переименованный в "1.dsl" и запустить скрипт. Появится файл "new.dsl".
Делать будет минуту-две, процесс в процентах отображается.
Словарь бухнет со 130 до 156 мб.

Таблицу конвертации брал от сюда - http://zh.wikipedia.org/zh/Wikipedia:繁简处理/简繁单字
2011.01.13
ЛС Ответить
2
>>>
Значит в оболочке была какая-то проблема. Ну и фиг с ней.
Скрипт, кстати, универсальный, можно любой поиск и замену с регулярками им делать.

2011.01.11eksodus при компиляции надо ставить галочку -
"Автоматически добавлять разметку" или нет ?
я компилировал без неё - всё работает
В нашем случае не надо. Это там размечать что-то для индекса, в БКРС этого нет.

Цитата:PS: дата файлов последнего словаря - январь 2012 года , похоже я опаздываю на год ))
Это у меня на компе дата из-за одного софта сдвинута на год. Будущее рядом.
2011.01.12
ЛС Ответить
3
>>>
А я на трех компьютерах проверил, как часы работает. Но все три XP. А у вас какая система?

По хорошему, кончено, надо логи сделать. Но лучше пойдем простым путем, особенно раз вы не боитесь внутренности программ видеть.

Скачайте и установите себе питон:
http://www.python.org/ftp/python/3.1.3/python-3.1.3.msi (14 мб)

Затем создайте файл с расширением .py и вставьте туда
Код:
import re

file_old = open('1.dsl', mode='r', encoding='utf-16-le')
file_new = open('new.dsl', mode='w', encoding='utf-16-le')

text = re.sub(r'^ (.+)\n ', r' \[\1\]\n ', file_old.read(), flags=re.MULTILINE)

file_new.write(text)

Рядом с ним кладете файл словаря переименованный в 1.dsl
Запускаете файл скрипта двойным щелчком.
В этой же папке должен появится исправленный new.dsl

Тут вроде нечему не работать. По сути это та же программа, что и ранее, только без графической оболочки.
И тут если будет не работать, то можно будет ошибки проследить.
2011.01.10
ЛС Ответить
4
>>>
Что значит "затихает"? Он может зависнуть на пол минуты-минуту, как и написано, в это время размер файла будет нулевым. Если пол минуты подождать, то он все сделает и файл заполнится. Зависит от компьютера, файлик то не маленький надо весь перелопатить.
Надпись появляется "идет конвертация" или "готово"?

Может и не работать, но тогда бы, скорее всего, ничего бы не создавал.

Попробуйте подождать, т.е. не трогать, если там процесс идет.
2011.01.10
ЛС Ответить
5
>>>
Программка для добавления скобок к пиньиню http://narod.ru/disk/3039447001/Pinyin.rar.html
Инструкция внутри.
2011.01.09
ЛС Ответить
6
>>>
Попозже сам сделаю. Я бы и показал, но если в текстовом редакторе это делать, то долго получится.

Регулярка типа:
^([^ ].*)\n^ (.+)$
заменить на
\1\n[\2]
но тут новая строка, не знаю сколько она будет делать, то ли несколько часов, то ли несколько дней.
2011.01.08
ЛС Ответить
7
>>>
Не знал о таком. Вряд ли будет в основной ветке, так как лишние символы мешают. Но сделать это не сложно, если очень надо можно отдельно.
2011.01.06
ЛС Ответить
8
>>>
Медицинский и русские имена. Тут о сателлитах подробней - https://bkrs.info/taolun/thread-202.html
Интересно, зачем эта информация?
2011.01.05
ЛС Ответить
9
>>>
Вверху слева на каждой странице (если вошли).
2011.01.05
ЛС Ответить
10
>>>
Вышла 42ая версия словаря. 938 новых слов, 5230 исправлений.
Два сателлита с несколькими тысячами новых слов.

Версия называется 兔, и последующие одиннадцать будут в честь этих 生肖.

Скачивание вверху слева, для зарегистрированных.

Следующая версия будет через два месяца.
2011.01.04
ЛС Ответить