http://yazyk.net/ Форум
Китаеведение * Предикационная концепция
 
 FAQFAQ   SearchSearch   MemberlistMemberlist   UsergroupsUsergroups   RegisterRegister 
 ProfileProfile   Log in to check your private messagesLog in to check your private messages   Log inLog in 

скрипты для проекта "Вэньянь"
Goto page 1, 2, 3, 4  Next
 
Post new topic   Reply to topic    Форум Forum Index -> Вэньянь и история языка
View previous topic :: View next topic  
Author Message
Сат Абхава



Joined: 31 Dec 2004
Posts: 1292
Location: Тайвань, Тайбэй

PostPosted: Tue Feb 01, 2005 6:51 pm    Post subject: скрипты для проекта "Вэньянь" Reply with quote

Написал маленький скрипт для участников предстоящего проекта. Скачать можно отсюда - CharCoach_v_1_0.rar

Внимание! Оба файла (те, что вы получите, распаковав архив) должны быть в одной и той же папке (т.е. перемещать вы их можете только вместе; файл .htm - сам скрипт, файл .js - его база)

Скрипт простой, как пять фэней. В качестве предварительной пробы забита база новых слов-иероглифов первого урока по Крюкову, т.е. 19 иероглифов (по мере прохождения уроков, база будет пополняться). Файл-хэлп к скрипту не писал, т.к. это займет времени в два раза больше, чем написание самого скрипта. Smile Уверен, что у вас все равно появятся вопросы, что да как. Спрашивайте в этой теме, разъясню все подробнейшим образом.

А пока лишь поясню назначение check-box:

1. пуст - при нажатии на кнопку "test" или "src" выдает результат в порядке следования данных в базе
отмечен - при нажатии на кнопку "test" или "src" выдает результат в случайно выбранном порядке

2. пуст - не отражает данные в поле "Иероглиф"
отмечен - отражает данные в поле "Иероглиф"

3. пуст - не отражает данные в поле "Пиньинь"
отмечен - отражает данные в поле "Пиньинь"

4. пуст - не отражает данные в поле "Перевод"
отмечен - отражает данные в поле "Перевод"

5. пуст - выбор из базы данных в режиме "Тест"
отмечен - выбор из базы данных в режиме "Поиск"

Три цифровых поля значат:
В режиме "Тест": 1 - индекс начального элемента в базе; 2 - индекс конечного элемента в базе; 3 - текущий элемент (по порядковому номеру из выбранных элементов)

В режиме "Поиск": 1 - начальный элемент базы (всегда 0); 2 - количество найденных данных, соответствующих запросу; 3 - текущий элемент (по порядковому номеру из выбранных элементов)

Вот такой вот "хэлп"... Very Happy Сам знаю, что ничего не поняли, а потому спрашивайте... Все покажу на скриншотах и все разъясню подробно - так быстрее научитесь, чем я буду длинный хэлп писать (все равно вопросами забросаете Very Happy )

Впрочем, еще одна подсказка, чтобы сами начали на скрипте хоть что-то "щелкать". Выполните следующую последовательность действий:

1. Запустите скрипт
2. Отметьте чекбокс 2.
3. Нажмите на кнопку "test"
4. Вспомните чтение и русское значение появившегося иероглифа
5. Нажмите кнопку "answ", чтобы проверить правильность своего ответа
6. Нажмите кнопку "next" для следующего задания.

Теперь, надеюсь, чуть-чуть ясно, что к чему...

В остальном жду ваших вопросов... Very Happy

_________________
Всё в моих речах может оказаться ошибкой...


Last edited by Сат Абхава on Mon Oct 17, 2005 7:05 pm; edited 1 time in total
Back to top
View user's profile Send private message
Jan



Joined: 02 Feb 2005
Posts: 175

PostPosted: Wed Feb 02, 2005 7:56 am    Post subject: Reply with quote

Уважаемый Сат Абхава, огромное спасибо за скрипт! Smile
Думаю, слова благодарности, скажу не я один.
У меня сразу появился вопрос - можно ли дополнить скрипт древними формами иероглифов цзягувэнь? Разумеется, в виде картинок Smile
Back to top
View user's profile Send private message
Oleg



Joined: 18 Jan 2005
Posts: 125

PostPosted: Wed Feb 02, 2005 3:36 pm    Post subject: Reply with quote

А поиск как работает?
У меня если отмечен пятый check-box, то активирована только кнопка SRС
Back to top
View user's profile Send private message
Сат Абхава



Joined: 31 Dec 2004
Posts: 1292
Location: Тайвань, Тайбэй

PostPosted: Wed Feb 02, 2005 4:13 pm    Post subject: Reply with quote

Jan wrote:
Уважаемый Сат Абхава, огромное спасибо за скрипт! Smile
Думаю, слова благодарности, скажу не я один.
У меня сразу появился вопрос - можно ли дополнить скрипт древними формами иероглифов цзягувэнь? Разумеется, в виде картинок Smile


Технически - всё можно, а вот практически... Рассмотрим ряд связанных с этим вопросов Confused :

1. Делать графику сканированием с толстенных каталогов (каталоги эти у меня есть) - дело небыстрое и довольно муторное. К тому же эта графика будет достаточно "тяжелой" для мобильного использования. Т.е. если и заниматься подготовкой подобной базы, то не ради "забав в свободное время".

2. Можно пойти другим путем - сделать специальный фонт. Например, нарезать отдельный фонт (под юникод) из цзягувэнь фонтов Гонконгского университета китайского языка, Пекинского пединститута и Тайбэйского института информационных технологий, выверив все как следует по тем же печатным изданиям. Но... Это значит, что нужно в этот фонт перебрать и "переписать" ручками более 4000 глифов. Сколько это может занять времени?

3. Кому, кроме узких специалистов, такие цзягувэнь формы нужны? Начинающие вряд ли станут пытаться читать реальные цзягувэнь надписи (впрочем, если будет желание, то можно будет и попробовать, базой цзягувэнь текстов я могу обеспечить Wink ). Хорошо уже будет, если участники нашего проекта научатся немного разбираться в подобных текстах, набранных в современных "кайшу"-формах. А ради удовлетворения праздного любопытства проводить такой большой объем работ - как-то меня, нисколько не в обиду кому-либо, это не очень вдохновляет. Very Happy

_________________
Всё в моих речах может оказаться ошибкой...
Back to top
View user's profile Send private message
Сат Абхава



Joined: 31 Dec 2004
Posts: 1292
Location: Тайвань, Тайбэй

PostPosted: Wed Feb 02, 2005 5:26 pm    Post subject: Reply with quote

Oleg wrote:
А поиск как работает?


Вот! Уже пошли конкретные вопросы по работе со скриптом. Это радует.

Oleg wrote:
У меня если отмечен пятый check-box, то активирована только кнопка SRС


Все правильно. Так и должно быть. При переключении режимов с "test" на "src", все поля и чекбоксы очищаются, и активизируется только кнопка SRС. Теперь Вам следует ввести параметры поиска, т.е. в том текстовом поле, по которому Вы намерены искать (или сразу в нескольких), ввести требуемую строку для поиска. Например, в поле "русского перевода" набираем строку: назван (в запросах лучше использовать неизменяемую часть слова - по ней будут найдены все словоформы: название, названия, названий и даже названный Confused ). Затем устанавливаем отметки в чекбоксах тех полей, данные которых требуется сразу отражать (если установить сразу в трех, то скрипт отразит весь набор данных, т.е. будет работать в режиме "повторения", а не "теста", при этом кнопка ANSW блокируется, а прогон всех найденных данных осуществляется лишь кнопкой NEXT, в противном случае работа идет в режиме "теста", т.е. последовательным нажатием кнопок ANSW и NEXT).Допустим, что мы хотим работать в режиме "теста", а именно хотим, чтобы скрипт сразу выдавал нам лишь иероглиф и пиньинь, а перевод мы вспоминали сами. Для этого отмечаем боксы 2 и 3. Если мы хотим, чтобы это тестирование проводилось в представлении в случайном порядке, то отмечаем и бокс 1, если же в порядке следования данных в базе - оставляем бокс 1 пустым. Допустим, что нам нужно второе. Таким образом, исходная картина у нас получается следующая:



Тепрь жмем на SRС. Получаем следующее:



Это значит, что скрипт нашел в базе 8 данных, отвечающих критериям нашего запроса, и вывел первое из них. Далее схема работы, как и в режиме "теста" (нажатием кнопок ANSW и NEXT).

Задавать режим поиска можно и по нескольким параметрам, например, в поле "пиньинь" ввести: in , в поле "перевод" ввести: назван . Найдены будут данные, отвечающие обоим параметрам. Но здесь следует уяснить себе, как производится поиск по базе. Всего запрос может производится сразу по трем параметрам - "иероглиф", "пиньинь" и "перевод". Поиск в базе данных начинается с первого указанного параметра. Затем в найденных данных производится поиск по следующему параметру. И так далее. Если на каком-либо этапе поиск выдает нулевой результат, то появляется сообщение:

Search[цифра] result: 0

Цифра после Search указывает на тот этап (то поле параметра), по которому скрипт ничего не нашел. Например, если производится поиск по всем трем параметрам, и выдается результат:

Search2 result: 0

Это значит, что по первому параметру ("иероглиф") были найдены данные, а по второму параметру ("пиньинь") в этих найденных данных совпадений не нашлось. Поэтому конечный результат поиска (даже без обращения к третьему параметру "перевод") - 0. Другими словами, вы можете подкорректировать свой запрос именно в том параметре, поиск по которому выдал нулевой результат.

Еще сразу скажу о двух особенностях.

В режиме "тест" Вы можете задавать желаемые границы работы с базой. Например, перед нажатием на кнопку test определить, что намерены лишь прорабатывать данные с 10 (ввести в первое цифровое поле) по 15 (ввести во второе цифровое поле). Лишь затем нажать на test . Если при этом будет отмечена и опция бокса 1, то скрипт возьмет данные с 10 по 15, перетасует их и начнет выдавать по одному. Если опция бокса 1 не отмечена, то данные будут выдаваться в прямой последовательности. При отмеченной опции бокса 1 и при указании предела больше 100 (это на будущее Very Happy ) скрипт возьмет данные в указанном пределе, перетасует их и выдаст на выходе только 100 из них. То же произойдет, если бокс 1 отмечен в режиме "поиска", а найденных данных оказалось больше 100. Сделал я это намеренно, поскольку работа в режиме случайного выбора предназначена лишь для самоконтроля, а работать более чем со 100 заданиями никто из вас не станет. Для работы же с прямой последовательностью такого ограничения не существует, т.е. Вы можете прогонять базу в каких угодно пределах (хоть с первого до последнего).

Очень надеюсь, что что-то прояснил Вам этим своим сумбуром. Будут еще вопросы - спрашивайте.

Кстати, зная, что в наших рядах есть счастливые обладатели карманных ПК, я ваяю такой же скрипт и для них (только он уже будет не в Unicode, а в UTF-7). Поэтому и изначальную форму скрипта я подгонял под "пОкетный формат". Еще обратите внимание на автоматическую активизацию кнопок, что позволяет работать со скриптом лишь простым нажатием на Enter. Я это сделал намеренно, чтобы не ковыряться стилусом, а работать на покетах одним нажатием кнопки.

_________________
Всё в моих речах может оказаться ошибкой...
Back to top
View user's profile Send private message
Jan



Joined: 02 Feb 2005
Posts: 175

PostPosted: Thu Feb 03, 2005 7:46 am    Post subject: Reply with quote

Сат Абхава wrote:

Технически - всё можно, а вот практически... Рассмотрим ряд связанных с этим вопросов Confused :


Ох, нет, я вовсе не к этому спросил! Меня в первую очередь интересовала именно техническая возможность. Very Happy
Я прекрасно отдаю себе отчет в том, что работа это огромная и долгая. А изучение форм цзягувэнь - задача явно не первоочередная для начинающих.
Но теоретически подключить к скрипту базу архаических форм иероглифов было бы интересно хотя бы "для справки". Естественно, не 4 тысячи знаков, а хотя бы те, которые встречаются в первых уроках.
Чтобы в отдельном окошке было что-то типа:

=

=

Как добавлять "обычные" иероглифы в базу, вроде бы понятно. А как "забивать" в нее картинки я, увы, просто не знаю.

Но, по большому счету, это все конечно "игрушечки". Бог с ними Very Happy
Back to top
View user's profile Send private message
vk



Joined: 13 Jan 2005
Posts: 298
Location: Moscow, Russia

PostPosted: Thu Feb 03, 2005 8:18 am    Post subject: немного разобрался Reply with quote

замечательный скрипт
спасибо Сат Абхаве
вещь очень полезная для изучения древнекитайских текстов
Сейчас курс истории языка закончен - он у нас занимает обычно 1-й семестр учебного года на 2-м курсе,
но с сентабря будем пробовать подобные вещи на занятиях - если, конечно, автор не возражает.
Back to top
View user's profile Send private message Send e-mail Visit poster's website
Сат Абхава



Joined: 31 Dec 2004
Posts: 1292
Location: Тайвань, Тайбэй

PostPosted: Thu Feb 03, 2005 9:09 am    Post subject: Reply with quote

Jan wrote:
Ох, нет, я вовсе не к этому спросил! Меня в первую очередь интересовала именно техническая возможность. Very Happy


Современные технические возможности весьма широки, поэтому никаких преград я не вижу (даже с моими очень скудными знаниями в этих вопросах). Very Happy

Jan wrote:
Я прекрасно отдаю себе отчет в том, что работа это огромная и долгая. А изучение форм цзягувэнь - задача явно не первоочередная для начинающих.
Но теоретически подключить к скрипту базу архаических форм иероглифов было бы интересно хотя бы "для справки". Естественно, не 4 тысячи знаков, а хотя бы те, которые встречаются в первых уроках.

Чтобы в отдельном окошке было что-то типа:

=

=


Если ограничиться лишь лексическим набором учебника, то задача выглядит не столь грандиозной, стоит подумать. Я покумекаю чуток, поковыряюсь, посмотрим, что из этого получится... Very Happy

Jan wrote:
Как добавлять "обычные" иероглифы в базу, вроде бы понятно.


На этот счет Вы можете сильно не напрягаться. Будем пополнять базу организованно по мере изучения уроков. Я уже и скриптик написал, чтобы быстро форматировать новые слова урока в нужный вид. Файл базы в обновленном виде будет выкладываться для общего скачивания с каждым новым уроком.

Jan wrote:
А как "забивать" в нее картинки я, увы, просто не знаю.


Это у Вас самому сделать не получится, т.к. скрипт под такое не рассчитан. Я прикину возможные варианты (начну с варианта отдельного специального фонта, т.к. он будет легковеснее графики, а для карманных ПК каждый кБ памяти на вес золота Smile ) и напишу под это отдельный скрипт.

_________________
Всё в моих речах может оказаться ошибкой...
Back to top
View user's profile Send private message
Сат Абхава



Joined: 31 Dec 2004
Posts: 1292
Location: Тайвань, Тайбэй

PostPosted: Thu Feb 03, 2005 9:12 am    Post subject: Re: немного разобрался Reply with quote

VK wrote:
замечательный скрипт
спасибо Сат Абхаве
вещь очень полезная для изучения древнекитайских текстов
Сейчас курс истории языка закончен - он у нас занимает обычно 1-й семестр учебного года на 2-м курсе,
но с сентабря будем пробовать подобные вещи на занятиях - если, конечно, автор не возражает.


Разумеется, я не против. Пользуйтесь на здоровье и во благо учебного процесса! Very Happy

_________________
Всё в моих речах может оказаться ошибкой...
Back to top
View user's profile Send private message
Сат Абхава



Joined: 31 Dec 2004
Posts: 1292
Location: Тайвань, Тайбэй

PostPosted: Thu Feb 03, 2005 4:50 pm    Post subject: Reply with quote

Jan wrote:
Как добавлять "обычные" иероглифы в базу, вроде бы понятно. А как "забивать" в нее картинки я, увы, просто не знаю.


Так, поэкспериментировал с нарезкой фонта. Все равно дело муторное. Быстрее делать графикой. Поэтому договоримся так. Если у Вас (одного или с группой сотоварищей) хватит желания делать оцифровку и графические файлики цзягувэней, скажем, из книги М.В.Крюкова "Язык иньских надписей" - т.е. весь словарик в конце книги (он небольшой, но поработать нужно), то я готов под эту оцифровку написать скрипт-тренажер под вполне конкретные задачи, о которых Вы говорили выше. Если согласны, то я определимся с деталями данного проекта. Smile

_________________
Всё в моих речах может оказаться ошибкой...
Back to top
View user's profile Send private message
Jan



Joined: 02 Feb 2005
Posts: 175

PostPosted: Fri Feb 04, 2005 8:04 am    Post subject: Reply with quote

Сат Абхава wrote:
Так, поэкспериментировал с нарезкой фонта. Все равно дело муторное. Быстрее делать графикой. Поэтому договоримся так. Если у Вас (одного или с группой сотоварищей) хватит желания делать оцифровку и графические файлики цзягувэней, скажем, из книги М.В.Крюкова "Язык иньских надписей" - т.е. весь словарик в конце книги (он небольшой, но поработать нужно), то я готов под эту оцифровку написать скрипт-тренажер под вполне конкретные задачи, о которых Вы говорили выше. Если согласны, то я определимся с деталями данного проекта. Smile


Сделать графические файлы в jpg я готов Very Happy Подойдут ли они для срипта в таком виде, в каком они были представлены выше? "Весят" такие картинки 1,5 - 2 КБ.

UPDATE

Картинки готовы.
В общей сложности получилось 273 иероглифа.
В заархивированном виде все они "весят" 450 КБ.
Единственное "но" - размер рисунков разный.
Но если нужно, могу все привести к единому формату.
Back to top
View user's profile Send private message
Сат Абхава



Joined: 31 Dec 2004
Posts: 1292
Location: Тайвань, Тайбэй

PostPosted: Fri Feb 04, 2005 3:18 pm    Post subject: Reply with quote

Jan wrote:
Сделать графические файлы в jpg я готов Very Happy Подойдут ли они для срипта в таком виде, в каком они были представлены выше? "Весят" такие картинки 1,5 - 2 КБ.

UPDATE

Картинки готовы.
В общей сложности получилось 273 иероглифа.
В заархивированном виде все они "весят" 450 КБ.
Единственное "но" - размер рисунков разный.
Но если нужно, могу все привести к единому формату.


Ух, какой Вы быстрый... Very Happy Картинки требуется привести к единому размеру. Желательно, чтобы это был строгий квадрат с размером грани порядка 70-75 px. В крайнем случае можно и прямоугольник (вытянутый по горизонтали) с размером граней 70-85 * 70-75 px. Условие остается прежним - единый размер для всех изображений. Кстати, еще можете попробовать конвертнуть их в черно-белые гифы, может, так они еще меньше весить будут (про бэкап не забудьте).

Однако картинки - это только полдела. К ним еще, как минимум, необходимо иероглифы набивать, да к тому же каждый иероглиф с именем файла его картинки соотносить. Это уже будет хоть какая-то база для скрипта. Если чтением и русским переводом Вы готовы пожертвовать, то сделаем вариант-минимум.

_________________
Всё в моих речах может оказаться ошибкой...
Back to top
View user's profile Send private message
Jan



Joined: 02 Feb 2005
Posts: 175

PostPosted: Mon Feb 07, 2005 7:24 am    Post subject: Reply with quote

Quote:

Картинки требуется привести к единому размеру. Желательно, чтобы это был строгий квадрат с размером грани порядка 70-75 px. В крайнем случае можно и прямоугольник (вытянутый по горизонтали) с размером граней 70-85 * 70-75 px. Условие остается прежним - единый размер для всех изображений. Кстати, еще можете попробовать конвертнуть их в черно-белые гифы, может, так они еще меньше весить будут (про бэкап не забудьте).

Однако картинки - это только полдела. К ним еще, как минимум, необходимо иероглифы набивать, да к тому же каждый иероглиф с именем файла его картинки соотносить. Это уже будет хоть какая-то база для скрипта. Если чтением и русским переводом Вы готовы пожертвовать, то сделаем вариант-минимум.


Ну зачем же жертвовать? Very Happy Делать - так уж делать.

Тогда, как я понял, задачи две:
1) Привести все картинки к одному формату, желательно к квадратикам. Только что там точно по пикселям получится я не знаю - иероглифы такие разные все. Но, думаю, получится 75 на 75.
2) "набить" в Word сами иероглифы, их чтения, значения и названия картинок, которые им соответствуют.

Приступаем Smile

UPDATE

Так-с, картинки готовы. 75 на 75. В гифы я пока их не конвертировал, но это могу тоже сделать.
Далее возникают такие вопросы:
1) чтение давать пиньинем с указанием тонов?
2) что делать с иероглифами, которых нет в юникоде?
(В частности, с тем самым гадателем, который в "языке иньских надписей" проходит как Цюэ, а в учебнике становится уже Цзюэ?)
3) что такое "бэкап" я не знаю Confused
Back to top
View user's profile Send private message
Сат Абхава



Joined: 31 Dec 2004
Posts: 1292
Location: Тайвань, Тайбэй

PostPosted: Mon Feb 07, 2005 3:04 pm    Post subject: Reply with quote

Jan wrote:
Так-с, картинки готовы. 75 на 75. В гифы я пока их не конвертировал, но это могу тоже сделать.


75*75 - это нормально. А в гифы конвертировать есть смысл только если файлы получатся "легче" по размеру.

Jan wrote:
1) чтение давать пиньинем с указанием тонов?


Желательно, с указанием тонов (цифрой после пиньиня без пробела, например, ma1).

Jan wrote:
2) что делать с иероглифами, которых нет в юникоде?


С этим туго. Скорее всего, ими придется пожертвовать. Пока пробуйте как-то обозначить их набором знаков, может, потом что придумаем.

Jan wrote:
3) что такое "бэкап" я не знаю Confused


"Бэкап" (back-up) - это сохранение резервной копии материала перед тем, как производить над ним серьезного рода операции (которые могут дать нежелательный результат).

По набору... Договоримся о следующем формате:

иероглиф[tab]пиньинь[tab]русский перевод[tab]имя файла-картинки (картинки лучше сразу вынести в отдельную папку, например, image/001.jpg)

[tab] - знак табуляции
Все четыре поля данных записывать в одну строку. Каждый очередной иероглиф - с новой строки.

_________________
Всё в моих речах может оказаться ошибкой...
Back to top
View user's profile Send private message
Paul_A



Joined: 20 Jan 2005
Posts: 113

PostPosted: Mon Feb 07, 2005 4:37 pm    Post subject: Reply with quote

Спасибо за скрипт, сегодня буду пробовать!
Back to top
View user's profile Send private message
Display posts from previous:   
Post new topic   Reply to topic    Форум Forum Index -> Вэньянь и история языка All times are GMT
Goto page 1, 2, 3, 4  Next
Page 1 of 4

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum
You cannot attach files in this forum
You cannot download files in this forum


Powered by phpBB 2.0.11 © 2001, 2002 phpBB Group