|
Форум Китаеведение * Предикационная концепция
|
View previous topic :: View next topic |
Author |
Message |
Сат Абхава
Joined: 31 Dec 2004 Posts: 1292 Location: Тайвань, Тайбэй
|
Posted: Tue Feb 01, 2005 6:51 pm Post subject: скрипты для проекта "Вэньянь" |
|
|
Написал маленький скрипт для участников предстоящего проекта. Скачать можно отсюда - CharCoach_v_1_0.rar
Внимание! Оба файла (те, что вы получите, распаковав архив) должны быть в одной и той же папке (т.е. перемещать вы их можете только вместе; файл .htm - сам скрипт, файл .js - его база)
Скрипт простой, как пять фэней. В качестве предварительной пробы забита база новых слов-иероглифов первого урока по Крюкову, т.е. 19 иероглифов (по мере прохождения уроков, база будет пополняться). Файл-хэлп к скрипту не писал, т.к. это займет времени в два раза больше, чем написание самого скрипта. Уверен, что у вас все равно появятся вопросы, что да как. Спрашивайте в этой теме, разъясню все подробнейшим образом.
А пока лишь поясню назначение check-box:
1. пуст - при нажатии на кнопку "test" или "src" выдает результат в порядке следования данных в базе
отмечен - при нажатии на кнопку "test" или "src" выдает результат в случайно выбранном порядке
2. пуст - не отражает данные в поле "Иероглиф"
отмечен - отражает данные в поле "Иероглиф"
3. пуст - не отражает данные в поле "Пиньинь"
отмечен - отражает данные в поле "Пиньинь"
4. пуст - не отражает данные в поле "Перевод"
отмечен - отражает данные в поле "Перевод"
5. пуст - выбор из базы данных в режиме "Тест"
отмечен - выбор из базы данных в режиме "Поиск"
Три цифровых поля значат:
В режиме "Тест": 1 - индекс начального элемента в базе; 2 - индекс конечного элемента в базе; 3 - текущий элемент (по порядковому номеру из выбранных элементов)
В режиме "Поиск": 1 - начальный элемент базы (всегда 0); 2 - количество найденных данных, соответствующих запросу; 3 - текущий элемент (по порядковому номеру из выбранных элементов)
Вот такой вот "хэлп"... Сам знаю, что ничего не поняли, а потому спрашивайте... Все покажу на скриншотах и все разъясню подробно - так быстрее научитесь, чем я буду длинный хэлп писать (все равно вопросами забросаете )
Впрочем, еще одна подсказка, чтобы сами начали на скрипте хоть что-то "щелкать". Выполните следующую последовательность действий:
1. Запустите скрипт
2. Отметьте чекбокс 2.
3. Нажмите на кнопку "test"
4. Вспомните чтение и русское значение появившегося иероглифа
5. Нажмите кнопку "answ", чтобы проверить правильность своего ответа
6. Нажмите кнопку "next" для следующего задания.
Теперь, надеюсь, чуть-чуть ясно, что к чему...
В остальном жду ваших вопросов... _________________ Всё в моих речах может оказаться ошибкой...
Last edited by Сат Абхава on Mon Oct 17, 2005 7:05 pm; edited 1 time in total |
|
Back to top |
|
|
Jan
Joined: 02 Feb 2005 Posts: 175
|
Posted: Wed Feb 02, 2005 7:56 am Post subject: |
|
|
Уважаемый Сат Абхава, огромное спасибо за скрипт!
Думаю, слова благодарности, скажу не я один.
У меня сразу появился вопрос - можно ли дополнить скрипт древними формами иероглифов цзягувэнь? Разумеется, в виде картинок |
|
Back to top |
|
|
Oleg
Joined: 18 Jan 2005 Posts: 125
|
Posted: Wed Feb 02, 2005 3:36 pm Post subject: |
|
|
А поиск как работает?
У меня если отмечен пятый check-box, то активирована только кнопка SRС |
|
Back to top |
|
|
Сат Абхава
Joined: 31 Dec 2004 Posts: 1292 Location: Тайвань, Тайбэй
|
Posted: Wed Feb 02, 2005 4:13 pm Post subject: |
|
|
Jan wrote: |
Уважаемый Сат Абхава, огромное спасибо за скрипт!
Думаю, слова благодарности, скажу не я один.
У меня сразу появился вопрос - можно ли дополнить скрипт древними формами иероглифов цзягувэнь? Разумеется, в виде картинок |
Технически - всё можно, а вот практически... Рассмотрим ряд связанных с этим вопросов :
1. Делать графику сканированием с толстенных каталогов (каталоги эти у меня есть) - дело небыстрое и довольно муторное. К тому же эта графика будет достаточно "тяжелой" для мобильного использования. Т.е. если и заниматься подготовкой подобной базы, то не ради "забав в свободное время".
2. Можно пойти другим путем - сделать специальный фонт. Например, нарезать отдельный фонт (под юникод) из цзягувэнь фонтов Гонконгского университета китайского языка, Пекинского пединститута и Тайбэйского института информационных технологий, выверив все как следует по тем же печатным изданиям. Но... Это значит, что нужно в этот фонт перебрать и "переписать" ручками более 4000 глифов. Сколько это может занять времени?
3. Кому, кроме узких специалистов, такие цзягувэнь формы нужны? Начинающие вряд ли станут пытаться читать реальные цзягувэнь надписи (впрочем, если будет желание, то можно будет и попробовать, базой цзягувэнь текстов я могу обеспечить ). Хорошо уже будет, если участники нашего проекта научатся немного разбираться в подобных текстах, набранных в современных "кайшу"-формах. А ради удовлетворения праздного любопытства проводить такой большой объем работ - как-то меня, нисколько не в обиду кому-либо, это не очень вдохновляет. _________________ Всё в моих речах может оказаться ошибкой... |
|
Back to top |
|
|
Сат Абхава
Joined: 31 Dec 2004 Posts: 1292 Location: Тайвань, Тайбэй
|
Posted: Wed Feb 02, 2005 5:26 pm Post subject: |
|
|
Oleg wrote: |
А поиск как работает? |
Вот! Уже пошли конкретные вопросы по работе со скриптом. Это радует.
Oleg wrote: |
У меня если отмечен пятый check-box, то активирована только кнопка SRС |
Все правильно. Так и должно быть. При переключении режимов с "test" на "src", все поля и чекбоксы очищаются, и активизируется только кнопка SRС. Теперь Вам следует ввести параметры поиска, т.е. в том текстовом поле, по которому Вы намерены искать (или сразу в нескольких), ввести требуемую строку для поиска. Например, в поле "русского перевода" набираем строку: назван (в запросах лучше использовать неизменяемую часть слова - по ней будут найдены все словоформы: название, названия, названий и даже названный ). Затем устанавливаем отметки в чекбоксах тех полей, данные которых требуется сразу отражать (если установить сразу в трех, то скрипт отразит весь набор данных, т.е. будет работать в режиме "повторения", а не "теста", при этом кнопка ANSW блокируется, а прогон всех найденных данных осуществляется лишь кнопкой NEXT, в противном случае работа идет в режиме "теста", т.е. последовательным нажатием кнопок ANSW и NEXT).Допустим, что мы хотим работать в режиме "теста", а именно хотим, чтобы скрипт сразу выдавал нам лишь иероглиф и пиньинь, а перевод мы вспоминали сами. Для этого отмечаем боксы 2 и 3. Если мы хотим, чтобы это тестирование проводилось в представлении в случайном порядке, то отмечаем и бокс 1, если же в порядке следования данных в базе - оставляем бокс 1 пустым. Допустим, что нам нужно второе. Таким образом, исходная картина у нас получается следующая:
Тепрь жмем на SRС. Получаем следующее:
Это значит, что скрипт нашел в базе 8 данных, отвечающих критериям нашего запроса, и вывел первое из них. Далее схема работы, как и в режиме "теста" (нажатием кнопок ANSW и NEXT).
Задавать режим поиска можно и по нескольким параметрам, например, в поле "пиньинь" ввести: in , в поле "перевод" ввести: назван . Найдены будут данные, отвечающие обоим параметрам. Но здесь следует уяснить себе, как производится поиск по базе. Всего запрос может производится сразу по трем параметрам - "иероглиф", "пиньинь" и "перевод". Поиск в базе данных начинается с первого указанного параметра. Затем в найденных данных производится поиск по следующему параметру. И так далее. Если на каком-либо этапе поиск выдает нулевой результат, то появляется сообщение:
Search[цифра] result: 0
Цифра после Search указывает на тот этап (то поле параметра), по которому скрипт ничего не нашел. Например, если производится поиск по всем трем параметрам, и выдается результат:
Search2 result: 0
Это значит, что по первому параметру ("иероглиф") были найдены данные, а по второму параметру ("пиньинь") в этих найденных данных совпадений не нашлось. Поэтому конечный результат поиска (даже без обращения к третьему параметру "перевод") - 0. Другими словами, вы можете подкорректировать свой запрос именно в том параметре, поиск по которому выдал нулевой результат.
Еще сразу скажу о двух особенностях.
В режиме "тест" Вы можете задавать желаемые границы работы с базой. Например, перед нажатием на кнопку test определить, что намерены лишь прорабатывать данные с 10 (ввести в первое цифровое поле) по 15 (ввести во второе цифровое поле). Лишь затем нажать на test . Если при этом будет отмечена и опция бокса 1, то скрипт возьмет данные с 10 по 15, перетасует их и начнет выдавать по одному. Если опция бокса 1 не отмечена, то данные будут выдаваться в прямой последовательности. При отмеченной опции бокса 1 и при указании предела больше 100 (это на будущее ) скрипт возьмет данные в указанном пределе, перетасует их и выдаст на выходе только 100 из них. То же произойдет, если бокс 1 отмечен в режиме "поиска", а найденных данных оказалось больше 100. Сделал я это намеренно, поскольку работа в режиме случайного выбора предназначена лишь для самоконтроля, а работать более чем со 100 заданиями никто из вас не станет. Для работы же с прямой последовательностью такого ограничения не существует, т.е. Вы можете прогонять базу в каких угодно пределах (хоть с первого до последнего).
Очень надеюсь, что что-то прояснил Вам этим своим сумбуром. Будут еще вопросы - спрашивайте.
Кстати, зная, что в наших рядах есть счастливые обладатели карманных ПК, я ваяю такой же скрипт и для них (только он уже будет не в Unicode, а в UTF-7). Поэтому и изначальную форму скрипта я подгонял под "пОкетный формат". Еще обратите внимание на автоматическую активизацию кнопок, что позволяет работать со скриптом лишь простым нажатием на Enter. Я это сделал намеренно, чтобы не ковыряться стилусом, а работать на покетах одним нажатием кнопки. _________________ Всё в моих речах может оказаться ошибкой... |
|
Back to top |
|
|
Jan
Joined: 02 Feb 2005 Posts: 175
|
Posted: Thu Feb 03, 2005 7:46 am Post subject: |
|
|
Сат Абхава wrote: |
Технически - всё можно, а вот практически... Рассмотрим ряд связанных с этим вопросов :
|
Ох, нет, я вовсе не к этому спросил! Меня в первую очередь интересовала именно техническая возможность.
Я прекрасно отдаю себе отчет в том, что работа это огромная и долгая. А изучение форм цзягувэнь - задача явно не первоочередная для начинающих.
Но теоретически подключить к скрипту базу архаических форм иероглифов было бы интересно хотя бы "для справки". Естественно, не 4 тысячи знаков, а хотя бы те, которые встречаются в первых уроках.
Чтобы в отдельном окошке было что-то типа:
雨 =
允 =
Как добавлять "обычные" иероглифы в базу, вроде бы понятно. А как "забивать" в нее картинки я, увы, просто не знаю.
Но, по большому счету, это все конечно "игрушечки". Бог с ними |
|
Back to top |
|
|
vk
Joined: 13 Jan 2005 Posts: 298 Location: Moscow, Russia
|
Posted: Thu Feb 03, 2005 8:18 am Post subject: немного разобрался |
|
|
замечательный скрипт
спасибо Сат Абхаве
вещь очень полезная для изучения древнекитайских текстов
Сейчас курс истории языка закончен - он у нас занимает обычно 1-й семестр учебного года на 2-м курсе,
но с сентабря будем пробовать подобные вещи на занятиях - если, конечно, автор не возражает. |
|
Back to top |
|
|
Сат Абхава
Joined: 31 Dec 2004 Posts: 1292 Location: Тайвань, Тайбэй
|
Posted: Thu Feb 03, 2005 9:09 am Post subject: |
|
|
Jan wrote: |
Ох, нет, я вовсе не к этому спросил! Меня в первую очередь интересовала именно техническая возможность. |
Современные технические возможности весьма широки, поэтому никаких преград я не вижу (даже с моими очень скудными знаниями в этих вопросах).
Jan wrote: |
Я прекрасно отдаю себе отчет в том, что работа это огромная и долгая. А изучение форм цзягувэнь - задача явно не первоочередная для начинающих.
Но теоретически подключить к скрипту базу архаических форм иероглифов было бы интересно хотя бы "для справки". Естественно, не 4 тысячи знаков, а хотя бы те, которые встречаются в первых уроках.
Чтобы в отдельном окошке было что-то типа:
雨 =
允 = |
Если ограничиться лишь лексическим набором учебника, то задача выглядит не столь грандиозной, стоит подумать. Я покумекаю чуток, поковыряюсь, посмотрим, что из этого получится...
Jan wrote: |
Как добавлять "обычные" иероглифы в базу, вроде бы понятно. |
На этот счет Вы можете сильно не напрягаться. Будем пополнять базу организованно по мере изучения уроков. Я уже и скриптик написал, чтобы быстро форматировать новые слова урока в нужный вид. Файл базы в обновленном виде будет выкладываться для общего скачивания с каждым новым уроком.
Jan wrote: |
А как "забивать" в нее картинки я, увы, просто не знаю. |
Это у Вас самому сделать не получится, т.к. скрипт под такое не рассчитан. Я прикину возможные варианты (начну с варианта отдельного специального фонта, т.к. он будет легковеснее графики, а для карманных ПК каждый кБ памяти на вес золота ) и напишу под это отдельный скрипт. _________________ Всё в моих речах может оказаться ошибкой... |
|
Back to top |
|
|
Сат Абхава
Joined: 31 Dec 2004 Posts: 1292 Location: Тайвань, Тайбэй
|
Posted: Thu Feb 03, 2005 9:12 am Post subject: Re: немного разобрался |
|
|
VK wrote: |
замечательный скрипт
спасибо Сат Абхаве
вещь очень полезная для изучения древнекитайских текстов
Сейчас курс истории языка закончен - он у нас занимает обычно 1-й семестр учебного года на 2-м курсе,
но с сентабря будем пробовать подобные вещи на занятиях - если, конечно, автор не возражает. |
Разумеется, я не против. Пользуйтесь на здоровье и во благо учебного процесса! _________________ Всё в моих речах может оказаться ошибкой... |
|
Back to top |
|
|
Сат Абхава
Joined: 31 Dec 2004 Posts: 1292 Location: Тайвань, Тайбэй
|
Posted: Thu Feb 03, 2005 4:50 pm Post subject: |
|
|
Jan wrote: |
Как добавлять "обычные" иероглифы в базу, вроде бы понятно. А как "забивать" в нее картинки я, увы, просто не знаю. |
Так, поэкспериментировал с нарезкой фонта. Все равно дело муторное. Быстрее делать графикой. Поэтому договоримся так. Если у Вас (одного или с группой сотоварищей) хватит желания делать оцифровку и графические файлики цзягувэней, скажем, из книги М.В.Крюкова "Язык иньских надписей" - т.е. весь словарик в конце книги (он небольшой, но поработать нужно), то я готов под эту оцифровку написать скрипт-тренажер под вполне конкретные задачи, о которых Вы говорили выше. Если согласны, то я определимся с деталями данного проекта. _________________ Всё в моих речах может оказаться ошибкой... |
|
Back to top |
|
|
Jan
Joined: 02 Feb 2005 Posts: 175
|
Posted: Fri Feb 04, 2005 8:04 am Post subject: |
|
|
Сат Абхава wrote: |
Так, поэкспериментировал с нарезкой фонта. Все равно дело муторное. Быстрее делать графикой. Поэтому договоримся так. Если у Вас (одного или с группой сотоварищей) хватит желания делать оцифровку и графические файлики цзягувэней, скажем, из книги М.В.Крюкова "Язык иньских надписей" - т.е. весь словарик в конце книги (он небольшой, но поработать нужно), то я готов под эту оцифровку написать скрипт-тренажер под вполне конкретные задачи, о которых Вы говорили выше. Если согласны, то я определимся с деталями данного проекта. |
Сделать графические файлы в jpg я готов Подойдут ли они для срипта в таком виде, в каком они были представлены выше? "Весят" такие картинки 1,5 - 2 КБ.
UPDATE
Картинки готовы.
В общей сложности получилось 273 иероглифа.
В заархивированном виде все они "весят" 450 КБ.
Единственное "но" - размер рисунков разный.
Но если нужно, могу все привести к единому формату. |
|
Back to top |
|
|
Сат Абхава
Joined: 31 Dec 2004 Posts: 1292 Location: Тайвань, Тайбэй
|
Posted: Fri Feb 04, 2005 3:18 pm Post subject: |
|
|
Jan wrote: |
Сделать графические файлы в jpg я готов Подойдут ли они для срипта в таком виде, в каком они были представлены выше? "Весят" такие картинки 1,5 - 2 КБ.
UPDATE
Картинки готовы.
В общей сложности получилось 273 иероглифа.
В заархивированном виде все они "весят" 450 КБ.
Единственное "но" - размер рисунков разный.
Но если нужно, могу все привести к единому формату. |
Ух, какой Вы быстрый... Картинки требуется привести к единому размеру. Желательно, чтобы это был строгий квадрат с размером грани порядка 70-75 px. В крайнем случае можно и прямоугольник (вытянутый по горизонтали) с размером граней 70-85 * 70-75 px. Условие остается прежним - единый размер для всех изображений. Кстати, еще можете попробовать конвертнуть их в черно-белые гифы, может, так они еще меньше весить будут (про бэкап не забудьте).
Однако картинки - это только полдела. К ним еще, как минимум, необходимо иероглифы набивать, да к тому же каждый иероглиф с именем файла его картинки соотносить. Это уже будет хоть какая-то база для скрипта. Если чтением и русским переводом Вы готовы пожертвовать, то сделаем вариант-минимум. _________________ Всё в моих речах может оказаться ошибкой... |
|
Back to top |
|
|
Jan
Joined: 02 Feb 2005 Posts: 175
|
Posted: Mon Feb 07, 2005 7:24 am Post subject: |
|
|
Quote: |
Картинки требуется привести к единому размеру. Желательно, чтобы это был строгий квадрат с размером грани порядка 70-75 px. В крайнем случае можно и прямоугольник (вытянутый по горизонтали) с размером граней 70-85 * 70-75 px. Условие остается прежним - единый размер для всех изображений. Кстати, еще можете попробовать конвертнуть их в черно-белые гифы, может, так они еще меньше весить будут (про бэкап не забудьте).
Однако картинки - это только полдела. К ним еще, как минимум, необходимо иероглифы набивать, да к тому же каждый иероглиф с именем файла его картинки соотносить. Это уже будет хоть какая-то база для скрипта. Если чтением и русским переводом Вы готовы пожертвовать, то сделаем вариант-минимум. |
Ну зачем же жертвовать? Делать - так уж делать.
Тогда, как я понял, задачи две:
1) Привести все картинки к одному формату, желательно к квадратикам. Только что там точно по пикселям получится я не знаю - иероглифы такие разные все. Но, думаю, получится 75 на 75.
2) "набить" в Word сами иероглифы, их чтения, значения и названия картинок, которые им соответствуют.
Приступаем
UPDATE
Так-с, картинки готовы. 75 на 75. В гифы я пока их не конвертировал, но это могу тоже сделать.
Далее возникают такие вопросы:
1) чтение давать пиньинем с указанием тонов?
2) что делать с иероглифами, которых нет в юникоде?
(В частности, с тем самым гадателем, который в "языке иньских надписей" проходит как Цюэ, а в учебнике становится уже Цзюэ?)
3) что такое "бэкап" я не знаю |
|
Back to top |
|
|
Сат Абхава
Joined: 31 Dec 2004 Posts: 1292 Location: Тайвань, Тайбэй
|
Posted: Mon Feb 07, 2005 3:04 pm Post subject: |
|
|
Jan wrote: |
Так-с, картинки готовы. 75 на 75. В гифы я пока их не конвертировал, но это могу тоже сделать. |
75*75 - это нормально. А в гифы конвертировать есть смысл только если файлы получатся "легче" по размеру.
Jan wrote: |
1) чтение давать пиньинем с указанием тонов? |
Желательно, с указанием тонов (цифрой после пиньиня без пробела, например, ma1).
Jan wrote: |
2) что делать с иероглифами, которых нет в юникоде? |
С этим туго. Скорее всего, ими придется пожертвовать. Пока пробуйте как-то обозначить их набором знаков, может, потом что придумаем.
Jan wrote: |
3) что такое "бэкап" я не знаю |
"Бэкап" (back-up) - это сохранение резервной копии материала перед тем, как производить над ним серьезного рода операции (которые могут дать нежелательный результат).
По набору... Договоримся о следующем формате:
иероглиф[tab]пиньинь[tab]русский перевод[tab]имя файла-картинки (картинки лучше сразу вынести в отдельную папку, например, image/001.jpg)
[tab] - знак табуляции
Все четыре поля данных записывать в одну строку. Каждый очередной иероглиф - с новой строки. _________________ Всё в моих речах может оказаться ошибкой... |
|
Back to top |
|
|
Paul_A
Joined: 20 Jan 2005 Posts: 113
|
Posted: Mon Feb 07, 2005 4:37 pm Post subject: |
|
|
Спасибо за скрипт, сегодня буду пробовать! |
|
Back to top |
|
|
|
|
You cannot post new topics in this forum You cannot reply to topics in this forum You cannot edit your posts in this forum You cannot delete your posts in this forum You cannot vote in polls in this forum You cannot attach files in this forum You cannot download files in this forum
|
Powered by phpBB 2.0.11 © 2001, 2002 phpBB Group
|