1 2 >>> + 🔎
1
Уважаемый БКРС!
За время работы в Китае мной был создан самодельный сайт, наподобие вашего, но уступающий некоторым функционалом. За основу был взят словарь с вашего сайте. В своем проекте я постарался оснастить сайт некоторыми возможностями, которых у вас нет. В настоящее время данный проект пылится без дела, и мне хочется чтобы работа не пропала зря, поэтому хочу поделится с форумчанами своим проектом, и также исходным кодом, который быть может заинтересует других разработчиков.
Полную рабочую версию можно скачать отсюда, а исходный код выложен
здесь
Рабочую версию нужно просто распаковать в любое место и запустить, первое время скорость перевода будет немного ниже, но с увеличением количества запросов скорость постепенно возрастет. Дело в том, что на сайте используется алгоритм разбора словарной статьи БКРС на варианты перевода, который работает так сказать "на лету". Основной упор делался на разработку переводчика, наподобие "Гугл-переводчика", но основанном на словаре. Функционал можно перенести и на ваш сайт, если доработать серверный API. Буду рад, если моя работа хоть кому то пригодится!





2018.04.24
Тема Ответить
2
Нужная фича однако. А то всё: "Не больше 100 иероглифов. Вы ввели 351."
2018.04.24
Тема Ответить
3
Работа выглядит титанической.

К сожалению, не смог запустить, что-то с бд. Причина отсутствия демонстрации, как я понимаю, что дешёвый сервер не прокатит.

2018.04.24tyrbonit Дело в том, что на сайте используется алгоритм разбора словарной статьи БКРС на варианты перевода, который работает так сказать "на лету". Основной упор делался на разработку переводчика, наподобие "Гугл-переводчика", но основанном на словаре.
У меня есть такой самопильный на руби и текстовых файлах (база mysql локального сайта). Думал можно ли сделать это на сайте, но пришёл к выводу, что это придётся сильно менять структуру словаря (уменьшить варианты) и всё равно будет много месива.
Поэтому было бы интересно взглянуть что у вас получилось и как устроено.

Потом ещё попытаюсь запустить (PostgreSQL что-то не встаёт, с двух источников пробовал, на sqlite можно?), любопытно что вы там наделали.
2018.04.24
Тема Ответить
4
2018.04.24Самба Нужная фича однако. А то всё: "Не больше 100 иероглифов. Вы ввели 351."
А зачем вам такие объёмы для пословного перевода? 100 иероглифов это несколько предложений, страница с переводом всех слов слишком громадной получается.
2018.04.24
Тема Ответить
5
2018.04.24tyrbonit с увеличением количества запросов скорость постепенно возрастет
Почему так, индексация не сразу?
2018.04.24
Тема Ответить
6
А вот писали бы вы на пыхе ... 14
2018.04.24
Тема Ответить
7
Цитата:Почему так, индексация не сразу?
бкрс, нет, с индексацией движок БД сам работает и сразу создает. Дело тут в том, что вариантов перевода в БД на начальном этапе еще нет. Они создаются, если их нет, по мере обработки запроса и сохраняются. Это я сделал для того, чтобы не обрабатывать все статьи сразу (много времени занимает для 2,9 млн.слов), тем более иногда проскакивают ошибки парсинга, которые естественно правлю, и таким образом усовершенствую алгоритм разбора.
2018.04.24
Тема Ответить
8
бкрс,
Цитата:на sqlite можно?
Можно, но не советую, пройденный этап. Это и индексация вручную, и отсутствие параллельной записи-чтения, плюсом было только размер БД. Web2py по умолчанию использует данный движок БД.
Модуль pyDAL многие базы поддерживает, можно было и MySQL подсунуть, естественно пустую и затем заполнить, но мне нужна была портативность. На одном из моих хостингов данная самоделка уже работает с MySQL.

А что с PostgreSQL не так? Я запускаю на win x64.
2018.04.24
Тема Ответить
9
бкрс,
Цитата:А вот писали бы вы на пыхе ... 14
Питон как то ближе 14
2018.04.24
Тема Ответить
10
Ах, да фишка еще в том, что сделана функция перевода китайских цифр, дат и времени. В планах была реализация перевода сочетаний цифр со счетными словами, а также создание прописных вариантов перевода чисел (сделано пока только яваскрипте).



2018.04.24
Тема Ответить
1 2 >>> + 🔎