|
Форум Китаеведение * Предикационная концепция
|
View previous topic :: View next topic |
Author |
Message |
Сат Абхава
Joined: 31 Dec 2004 Posts: 1292 Location: Тайвань, Тайбэй
|
Posted: Sat Nov 12, 2005 10:28 am Post subject: "Цзиньвэнь чанъюн цзыдянь" (Чэнь Чушэн) |
|
|
Итак, поскольку вы выразили свое согласие взяться за обработку словаря Чэнь Чушэна, то я подготовил сканы индекса (вернее, двух индексов: один индекс по количеству черт, второй - по чтению пиньинь). Скачать индексы можно по ссылке:
http://rapidshare.de/files/7517909/JWChYZD_idx.rar.html
Теперь о том, что требуется от вас. Необходимо привести эти индексы к следующему формату ([tab] - знак табуляции):
иероглиф[tab]количество черт[tab]чтение пиньинь с цифр. обозначением[tab]номер страницы по словарю
Т.е.:
一[tab]01[tab]yi1[tab]0001
乙[tab]01[tab]yi3[tab]1146
八[tab]02[tab]ba1[tab]0077
и т.д. В какой последовательности вы будете составлять список - это не важно (но повторов одного и того же иероглифа старайтесь не допускать). Обратите внимание еще на два момента:
1. Цифровое обозначение количества черт должно быть 2-разрядным.
2. Цифровое обозначение номера страницы должно быть 4-разрядным.
Что же делать со знаками, которых нет в юникоде, - а такие в данном словаре встречаются - мне еще предстоит подумать.
Координацию работы и разрешение всех проблем будем проводить в этой теме. _________________ Всё в моих речах может оказаться ошибкой... |
|
Back to top |
|
|
Сат Абхава
Joined: 31 Dec 2004 Posts: 1292 Location: Тайвань, Тайбэй
|
Posted: Sat Nov 12, 2005 3:56 pm Post subject: |
|
|
Feng wrote: |
Сат Абхава, несовсем понятно как загружать файлы? на той ссылке что вы дали лежит какой-то софт... |
Поясняю последовательность закачки файлов из файлового хранилища RapidShare.De
1. Кликаем по приведенной ссылке: http://rapidshare.de/files/7517909/JWChYZD_idx.rar.html Откроется окно RapidShare.De, на котором вам будет предложено выбрать режим скачивания (в табличном виде - Choose download-type) - Select your download: Free or Premium
2. Поскольку вы не являетесь платным пользователем хранилища, то вы жмете кнопку Free. Вас перебросят на страницу для бесплатных клиентов, на которой появится сообщение (в самом низу страницы):
Quote: |
You have requested the file JWChYZD_idx.rar (833529 Bytes). This file has been downloaded 0 times already.
IMPORTANT: Download-accelerators are only supported with a PREMIUM-Account!
Download-Ticket reserved. Please wait 17 seconds.
Avoid the need for download-tickets by using a PREMIUM-Account. Instant access! |
Начнется отсчет времени (в секундах), после которого появится ссылка на сам файл, который вы можете закачать:
Quote: |
You have requested the file JWChYZD_idx.rar (833529 Bytes). This file has been downloaded 0 times already.
IMPORTANT: Download-accelerators are only supported with a PREMIUM-Account!
Download: JWChYZD_idx.rar |
3. Кликаете по этой появившейся ссылке - начинается закачка файла.
ВНИМАНИЕ!
1. Закачка файлов вашего браузера должна использовать стандартные средства Windows. Если вы обычно пользуетесь различными ускорителями-даунлоудерами (и запуск их на закачивание файла интегрирован в ваш броузер по умолчанию), то вам сначала следует отключить эти ускорители, т.к. закачка ими поддерживается только как платная услуга (а вы зашли на бесплатную халяву ).
2. Иногда бывает так, что сервер хранилища перегружен, и на результат этапа 2 выдаст сообщение о том, что в связи с перегрузкой вас не обслуживают. В этом случае вам просто нужно зайти позже. Как бы там ни было, заходя в хранилище, сразу направляйтесь в конец страницы и читайте, что там вам сообщают. "Тормозок" на закачивания файла, как правило, невелик, не больше минуты. Можно и подождать.
3. Для бесплатных клиентов установлены определенные лимиты:
а) одновременно можно закачивать только один файл
б) количество скаченных мегабайт за определенный отрезок времени не может превышать некоторой установленной величины (я ее не помню), т.е. если вы скачиваете несколько файлов один за другим, то, возможно, на каком-то очередном файле вы получите отказ от услуг - значит, ваш лимит скаченных мегабайтой на данный отрезок времени исчерпан, зайдите позже и продолжите закачку.
Одним словом, каждый раз читайте сообщения в самом низу страницы. Там всё сказано. _________________ Всё в моих речах может оказаться ошибкой... |
|
Back to top |
|
|
Feng
Joined: 08 Mar 2005 Posts: 284
|
Posted: Sat Nov 12, 2005 5:16 pm Post subject: |
|
|
ну что ж, начинаю с первой папки 01_idx_strokes, пожелайте мне терпения |
|
Back to top |
|
|
Сат Абхава
Joined: 31 Dec 2004 Posts: 1292 Location: Тайвань, Тайбэй
|
Posted: Sat Nov 12, 2005 7:39 pm Post subject: |
|
|
Feng wrote: |
ну что ж, начинаю с первой папки 01_idx_strokes, пожелайте мне терпения |
Мне кажется, что Вам проще было бы взять за основу работы вторую папку - индекс по пиньиню, т.к. посчитать количество черт у незнакомого иероглифа всегда проще, чем угадать его чтение. А первую папку Вы могли бы использовать лишь для сверки количества черт в тех иероглифах, где Вы сомневаетесь.
Впрочем, делайте так, как Вам удобней.
Желаю успеха и терпения! _________________ Всё в моих речах может оказаться ошибкой... |
|
Back to top |
|
|
Aiqing
Joined: 04 Apr 2005 Posts: 466
|
Posted: Mon Nov 14, 2005 12:09 pm Post subject: |
|
|
Чтобы не продублировать друг друга, хочу у Вас, Feng, уточнить -
с каким индексом Вы все же начали работать? |
|
Back to top |
|
|
Feng
Joined: 08 Mar 2005 Posts: 284
|
Posted: Mon Nov 14, 2005 4:50 pm Post subject: |
|
|
Aiqing
Quote: |
Чтобы не продублировать друг друга, хочу у Вас, Feng, уточнить - с каким индексом Вы все же начали работать? |
Я начала с первого индекса, по примеру Сат Абхавы, по количеству черт. Что касается неудобств, первые шесть страниц пролетели на одном дыхании , возможно дальше и будет сложнее, но так как я набиваю в "wenlin", это снимает многие проблемы, возникающие при обращении к словарю. |
|
Back to top |
|
|
Aiqing
Joined: 04 Apr 2005 Posts: 466
|
Posted: Tue Nov 15, 2005 3:28 am Post subject: |
|
|
Тогда я займусь индексом по пиньиню |
|
Back to top |
|
|
Сат Абхава
Joined: 31 Dec 2004 Posts: 1292 Location: Тайвань, Тайбэй
|
Posted: Tue Nov 15, 2005 10:59 am Post subject: |
|
|
Aiqing wrote: |
Тогда я займусь индексом по пиньиню |
Милые дамы! Зачем друг друга дублировать? Оба индекса имеют одно и то же содержание, только разную индексацию: первый - по чертам, второй - по пиньиню. Получится, что вы будете набирать одно и то же, только в разной последовательности. _________________ Всё в моих речах может оказаться ошибкой... |
|
Back to top |
|
|
Feng
Joined: 08 Mar 2005 Posts: 284
|
Posted: Tue Nov 22, 2005 4:54 am Post subject: |
|
|
я закончила свою часть, по ходу набивки обнаружилась опечатка, два разных иероглифа стоят в индексах под одним и тем же номером:
1) 越--12--yue4--0135 и ?--25--qu2--0135
2) 諾--15 или 16--nuo4--0242 - здесь опечатки нет, но так как ключ "трава" в индексе записывается 4 чертами, а у нас 3, то получается разночтения, Сат Абхава как записывать? как в индексе или как в действительности?
Из этой же серии若--08 или 09--ruo4--0065
3) два иероглифа под одним и тем же номером 苟(1 индекс)0870 и 匍(2 индекс)--09--pu2--0870 - видимо, 1 – опечатка
4) 祈--08--qi2--0027 почему-то во 2 индексе находится в разделе 9 черт
5) 邵--07--shao4—0669 почему то в индексе 1 стоит в разделе 8 черт
6)社--07--she4--0030 так же в разделе 8 черт
7)神--09--shen2--0018 так же в разделе 10 черт |
|
Back to top |
|
|
Сат Абхава
Joined: 31 Dec 2004 Posts: 1292 Location: Тайвань, Тайбэй
|
Posted: Tue Nov 22, 2005 8:15 am Post subject: |
|
|
Feng wrote: |
я закончила свою часть |
Вы просто молодчина! Вижу, что мне нужно ускорится с моей частью, чтобы как можно быстрее предоставить вам словарь для творческой работы.
Quote: |
по ходу набивки обнаружилась опечатка, два разных иероглифа стоят в индексах под одним и тем же номером: |
Вообще-то, это не "номера иероглифов", а номера страниц, на которых начинается словарная статья иеролифа. Повторы здесь вполне нормальны, но, тем не менее, я проверю каждый указанный Вами случай.
Quote: |
1) 越--12--yue4--0135 и ?--25--qu2--0135 |
Всё в порядке. Две словарные статьи на одной странице (первая - полностью, вторая - начало).
Quote: |
2) 諾--15 или 16--nuo4--0242 - здесь опечатки нет, но так как ключ "трава" в индексе записывается 4 чертами, а у нас 3, то получается разночтения, Сат Абхава как записывать? как в индексе или как в действительности? |
Это "у Вас" ключ "трава" пишется в 3 черты, а "у нас" (в гоюй, т.е. для путунхуа такое начертание можно считать "устаревшим" ), этот ключ до сих пор (по требованиям школьной программы) записывается (и считается) в 4 черты. Решение ситуации предлагаю ниже.
Quote: |
Из этой же серии若--08 или 09--ruo4--0065 |
См. выше.
Quote: |
3) два иероглифа под одним и тем же номером 苟(1 индекс)0870 и 匍(2 индекс)--09--pu2--0870 - видимо, 1 – опечатка |
Здесь всё в порядке.
Quote: |
4) 祈--08--qi2--0027 почему-то во 2 индексе находится в разделе 9 черт |
Здесь в словаре действительно ситуация несколько странная: кайшу-иероглифы с ключом 示 в левой части исчисляются по чертам то как с 示 (в "устаревшем" начертании - в 5 черт), то как с 礻(в современном начертании - 4 черты). Решение ситуации предлагаю ниже.
Quote: |
5) 邵--07--shao4—0669 почему то в индексе 1 стоит в разделе 8 черт |
В гоюй 阝исчисляется 3 чертами.
Quote: |
6)社--07--she4--0030 так же в разделе 8 черт
7)神--09--shen2--0018 так же в разделе 10 черт |
См. выше.
Теперь по решению возникшей ситуации. Предлагаю в подобных иероглифах приводить два индекса количества черт, разделяя их знаком "/". Поскольку у меня есть мысль свести индекс по чертам в отдельную словарную статью версии для Лингво, то мы просто получим то, что один и тот же иероглиф будет фигурировать в двух разделах индекса по чертам. Этим мы сможем убить сразу двух зайцев - расположить иероглифы по правилам и "устаревшей" и новой графики. Какие именно ключи попадают под этот случай, я распишу по словарям XDHYCD и GYCD, а пока можете править то, что уже обнаружили:
艹 3/4
礻 4/5
阝 2/3
Также прошу перечислить те иероглифы, которые Вы не нашли в фонтах, - будем совместно думать, как их представить.
У Вас так хорошо и быстро получилось разобраться с индексом, что невольно хочется предложить рассмотреть возможность сделать еще и индекс для 甲骨文字典 (сам словарь в сканах уже сделан в электронном виде - в формате pdf - и выложен на Полушарии в разделе "Электронная библиотека - Китайский раздел II" - если Вы зарегистрированный полушарец, то можете перейти сразу по ссылке, т.е. при наличии индекса для Лингво, подстроить под него сканы большого труда не составит). _________________ Всё в моих речах может оказаться ошибкой... |
|
Back to top |
|
|
Feng
Joined: 08 Mar 2005 Posts: 284
|
Posted: Tue Nov 22, 2005 4:18 pm Post subject: |
|
|
1) 尗--05--shu1--0722 в индексе 5 черт? должно быть 6 ? или опять разные нормы начертания?
2) 貄--13-- si4--0340 в индексе 15 черт, но и сам иероглиф не отчетливый, сомневаюсь
3) 肅--13--su4--0343 этот же иероглиф в индексе1 под страницей 342, писать также через слэш?
4) 提--12--ti2--0624 в индексе 13 черт
5) 韋--09--wei2--0606 в индексе 10
6) 衛--15--wei4--0214 в индексе 16
7) 烏--10--wu1--0634 и в первом индексе на странице 0436
8 ) 羞--10--xiu1--1164 в индексе 11
9) 嚴--19--yan2--0127 в индексе 20
10) 幺--03--yao1--0445 в индексе 02 |
|
Back to top |
|
|
Feng
Joined: 08 Mar 2005 Posts: 284
|
Posted: Tue Nov 22, 2005 4:59 pm Post subject: |
|
|
Quote: |
Также прошу перечислить те иероглифы, которые Вы не нашли в фонтах, - будем совместно думать, как их представить. |
㚔 08--nie4--0931
- 14--pu2--0141
䭫 15--qi3--0847
- 12--qi4--0441
- 15--qing4--0949
- 25--qu2--0135
- 25--quan2--0138
- 16--rang3--0126
- 26--ru4--0300
- 21--shang1--0709
䢦 14--shuai4--0157
㒸 09--sui4--0082
䣄 09/10--tu2--0671
- 10--tui4--0199
- 22--wang4--0262
10--wei1--0774
- 18--xi1--0140
- 11--xi1--0386
- 12--xian3--0345
- 17--xie4--0316
- 16--yan3--0299
- 11--yang2--0193
䌛 18--yao2--1067
㠯 05--yi3--1169
- 12--yi4--0244
- 22--yi4--0929
20--yi4--0986
㚤 06--yi4--1025
䖜 20--yin2--0535
13/14--yin2--0881
㱃 15--yin3--0837
- 17--ying4--0656
- 08--ying4--0781
- 15--yong1--0589
06--you1--0447
13--you1--0953
- 11--yu2--0978
28--yu4--0563
13--yuan2--0138
- 20--yuan2--0188
- 19--yue4--0222
06--zai1--1043
- 15--zai4--0309
- 18--zao4--0753
- 17--ze2--0279
13--zha1--0319
08--zheng1--0160
17--zheng4--0547
䰞 24--zhu3--0299
12--zhui4--0327
02--zuo3--0334
- 15--si4--0340
- 13--ti2--0624
намеренно копирую из вэньлина, чтобы вам было удобнее смотреть
Quote: |
У Вас так хорошо и быстро получилось разобраться с индексом, что невольно хочется предложить рассмотреть возможность сделать еще и индекс для 甲骨文字典 |
пожалуй, надо закончить сначала этот, а там видно будет
Last edited by Feng on Wed Nov 23, 2005 4:33 pm; edited 2 times in total |
|
Back to top |
|
|
Сат Абхава
Joined: 31 Dec 2004 Posts: 1292 Location: Тайвань, Тайбэй
|
Posted: Tue Nov 22, 2005 7:02 pm Post subject: |
|
|
Feng писал(а):
Quote: |
1) 尗--05--shu1--0722 в индексе 5 черт? должно быть 6 ? или опять разные нормы начертания? |
Ошибка: должно быть 6 черт.
Цитата:
Quote: |
2) 貄--13-- si4--0340 в индексе 15 черт, но и сам иероглиф не отчетливый, сомневаюсь |
Нет, там слева не 豸, а левая часть от . Скорее всего, нам придется заменить его современным начертанием - 肆.
Цитата:
Quote: |
3) 肅--13--su4--0343 этот же иероглиф в индексе1 под страницей 342, писать также через слэш? |
Словарная статья на него начинается на стр. 0342 (значит, 0343 - просто ошибка).
Цитата:
Quote: |
4) 提--12--ti2--0624 в индексе 13 черт |
Там в индексе не 提 , а
Цитата:
Quote: |
5) 韋--09--wei2--0606 в индексе 10 |
Всё верно: и должно быть 10 черт.
Цитата:
Quote: |
6) 衛--15--wei4--0214 в индексе 16 |
Верно: и должно быть 16 черт.
Цитата:
Quote: |
7) 烏--10--wu1--0634 и в первом индексе на странице 0436 |
Верно: 0436. (0634 - ошибка).
Цитата:
Quote: |
8 ) 羞--10--xiu1--1164 в индексе 11 |
Верно: 11 черт.
Цитата:
Quote: |
9) 嚴--19--yan2--0127 в индексе 20 |
Верно: 20 черт.
Цитата:
Quote: |
10) 幺--03--yao1--0445 в индексе 02 |
Ошибка: должно быть 3 черты. _________________ Всё в моих речах может оказаться ошибкой...
Last edited by Сат Абхава on Tue Nov 22, 2005 7:24 pm; edited 1 time in total |
|
Back to top |
|
|
Сат Абхава
Joined: 31 Dec 2004 Posts: 1292 Location: Тайвань, Тайбэй
|
Posted: Tue Nov 22, 2005 7:07 pm Post subject: |
|
|
Feng wrote: |
намеренно копирую из вэньлина, чтобы вам было удобнее смотреть |
Спасибо! Но у меня Вэньлинь не стоит, а потому я все равно знаков не вижу. Буду ориентироваться по указанным страницам.
Quote: |
пожалуй, надо закончить сначала этот, а там видно будет |
Разумеется! Сначала доведем до ума и выпустим в свет Лингво версию словаря Чэнь Чушэна (я попутно поколдую и над его pdf-версией, т.к. есть в этом словаре очень хорошая информация - в приложениях к словарю - которую прикрепить к Лингво, думаю, не получится). _________________ Всё в моих речах может оказаться ошибкой... |
|
Back to top |
|
|
Сат Абхава
Joined: 31 Dec 2004 Posts: 1292 Location: Тайвань, Тайбэй
|
Posted: Tue Nov 22, 2005 9:21 pm Post subject: |
|
|
Пока зарезервирую несколько условных знаков (суть их поясню позже):
■▲★◇△☆◎→←↑↓〖〗* _________________ Всё в моих речах может оказаться ошибкой...
Last edited by Сат Абхава on Wed Nov 23, 2005 6:44 pm; edited 2 times in total |
|
Back to top |
|
|
|
|
You cannot post new topics in this forum You cannot reply to topics in this forum You cannot edit your posts in this forum You cannot delete your posts in this forum You cannot vote in polls in this forum You cannot attach files in this forum You cannot download files in this forum
|
Powered by phpBB 2.0.11 © 2001, 2002 phpBB Group
|