1
Странно что для 姪 стоит автозамена на 侄, слова-то разные! И вообще предлагаю сделать возможность добавления слов на традиционных иероглифах (а если их нет - тогда только делать автозамену и поиск). А то в офлайн-версии невозможно работать с полными вариантами!

Цитата:
zhí
niece
2011.08.03
Тема Ответить
2
Кстати, в онлайн-версии словаря нельзя найти слова с заглавной буквы, если в поиск вбить всё строчными.
2011.08.03
Тема Ответить
3
姪 развязал с 侄.
Заглавные буквы исправил. Это недавно когда делал чтобы можно было менять регистр так получилось.

Цитата:предлагаю сделать возможность добавления слов на традиционных иероглифах (а если их нет - тогда только делать автозамену и поиск). А то в офлайн-версии невозможно работать с полными вариантами!
А что мешает пойти легким путем - сконвертировать текст в упрощенный? Или словарь в традиционный.
Можно даже на выходе делать двойные карточки.
То есть, конвертация это проблема софта, а не словаря.

Добавлять традиционные однозначно не вариант - это же полное дублирование. Все равно что на клавиатуре вместо шифта установить новые кнопки для заглавных.
2011.08.03
Тема Ответить
4
2011.08.03бкрс А что мешает пойти легким путем - сконвертировать текст в упрощенный? Или словарь в традиционный.
Можно даже на выходе делать двойные карточки.
Хм. Честно говоря я не в курсе как перевести словарь автоматом на традиционные, наверно об этом уже писали?

2011.08.03бкрс Добавлять традиционные однозначно не вариант - это же полное дублирование. Все равно что на клавиатуре вместо шифта установить новые кнопки для заглавных.
А не нужно дублировать, просто сделать ссылки на простой вариант. Лишь в некоторых местах добавить дополнительные разъяснения.
Причём можно сделать так, чтобы по умолчанию всё переводилось на простые как сейчас, но чтоб можно было в профиле отключить эту функцию.
Для чего всё это?
Чтобы словарь был удобнее для всех.
Чтобы повысить точность перевода, особенно когда речь идёт о вэньяне и древней литературе.
Чтобы привлечь ревностных сторонников традиционного написания)
Может это не слишком ощутимо, но как-никак улучшение.
2011.08.03
Тема Ответить
5
Не могу понять в чем проблема. Какие сейчас сложности у тех, кто пользуется традиционным и как вы хотите их исправить?

Добавить традиционные в офлайн - вот скрипт рядом кладете 1.dsl запускаете скрипт (нужен питон) рядом появится new.dsl с традиционными и упрощенными заголовками.
2011.08.03
Тема Ответить
6
2011.08.03бкрс Не могу понять в чем проблема. Какие сейчас сложности у тех, кто пользуется традиционным и как вы хотите их исправить?

Лично у меня сложность в том, что нужно пользоваться и теми и теми вариантами. Переводить в простые иногда возможности нет - текст в виде изображений, да и я не хочу забывать полный вариант, поэтому периодически читаю на нём. Когда под рукой инет - всё в порядке, но без него надо очень сильно мучаться с переводом отдельных иероглифов на простое написание.

Кроме того, иногда для понимания смысла и перевода нужно смотреть отдельные иероглифы, а не слова. На упрощённых иероглифах зачастую получается каша, за примером далеко ходить не надо - недавно обсуждали 干. А каждый раз внимательно просматривать десятки значений в толковых словарях отнимает много сил и времени.

2011.08.03бкрс Добавить традиционные в офлайн - вот скрипт рядом кладете 1.dsl запускаете скрипт (нужен питон) рядом появится new.dsl с традиционными и упрощенными заголовками.

Спасибо за скрипт!

Однако он не может перевести всё полноценно. Сразу бросаются в глаза такие вещи, как 发 и 發, 干 и 乾, и т. д. Именно поэтому я настаиваю на том, чтобы сделать словарь двувариантным, и даже можно тривариантым, т. к. некоторые иероглифы даже в традиционном написании имеют сокращённую форму. Например, обычно пишут 台灣, а не 臺灣, поэтому менять 台 на 臺 в скрипте наверно не нужно.

В любом случае, если автозамена на урощённые останется, нужно чтобы в заголовке словарной статьи тоже были упрощённые варианты, а не то, что было введено в поиск, как сейчас. Грубо говоря, если я вобью в онлайн-словарь 幹, то у меня появится статья 干, но в заголовке почему-то останется 幹, считаю, что это неправильно и сбивает с толку.
2011.08.04
Тема Ответить
7
2011.08.04Sapomaro зачастую
В том-то и дело, что не "зачастую", а весьма редко. И для очень немногих.
Кроме классических 发, 干 и еще какой-то мелочевки, все остальные 99.9% это преобразование 1 к 1.

Гораздо разумней найти список где простое преобразование отличается и вмонтировать его в конвертацию.

Сейчас я не представляю как это будет практически выглядеть. Придется городить кучу усложнений для конвертации. Опциями, естественно никто не пользуется. Будет все лежать мертвым грузом об который все будут спотыкаться и который требует поддержки. А профит - несколько иероглифов для извращенцев, которые переводят вэньянь по русским словарям Smile

Цитата:нужно чтобы в заголовке словарной статьи тоже были упрощённые варианты
Логично, но тут все-таки есть польза, так как в большинстве случаев это никак не влияет, а с толку сбивать многих может почему другой иероглиф.
2011.08.04
Тема Ответить
8
2011.08.04бкрс Гораздо практичней найти список где простое преобразование отличается и вмонтировать его в конвертацию.
Да, я тоже уже склоняюсь к этому.

2011.08.04бкрс Логично, но тут все-таки есть польза, так как в большинстве случаев это никак не влияет, а с толку сбивать многих может почему другой иероглиф.
Тогда предлагаю выводить оба варианта.
2011.08.04
Тема Ответить
9
Хочу спросить, может ли произойти что-нибудь страшное, если я переведу базу словаря из utf-16le в utf-8? Я немного пораскинул мозгами и решил, что можно без особого труда сделать дополнение к словарю с полными иерами через ПХП.

По задумке алгоритм по-очереди будет перебирать слова, создавая аналоги на полных вариантах в новом файле со ссылками на простые. Проблему с 发, 干 и т. д. можно решить добавляя любые возможные дубликаты, например, для 头发 это будет 頭髮 и 頭發. Неправильные слова можно будет потом как-нибудь подчистить.

Сообщу об успехах позже. Кстати, ни у кого нет списка упрощённых иероглифов с несколькими традиционными вариантами?
2011.08.04
Тема Ответить
10
utf-16le это только для лингвы. Всё остальное в utf-8 делается.

Официальный список перевода иероглифов есть, тут ссылки были. В википедии есть. Я из него и брал, только двойные убрал на более частые.
2011.08.04
Тема Ответить