1д бкрс Это скорее всего от браузера/системы зависит. Максимум, какое-то переключение текста или картинки.
Не понятен смысл pdf/печати, даже если кто-то распечатывает, он это как-то сам делает, а не из браузера. Лучше дать возможность удобно скопировать, например, в текстовый файл с хорошим форматированием (обычным не табличным).
В PDF иногда очень удобно сохранить выборку сделанную результатами поиска или заметками, чтобы лишний раз не обращаться к html.
Хорошая мысль, можно сохранять форматированный текст (нужно подумать над форматированием), в javascript сейчас есть функция чтобы сразу файл сохранить минуя неудобную копипасту
2д бкрс А есть ли смысл в этой библиотеке? Там же просто прогнать текст через пару регулярок.
Вот мой скрипт на питоне:
Код:
text = text.replace(' /', ' [m1]')
text = text.replace('/', '[/m][m1]')
text = text.replace('[m1]\n', '\n')
text = re.sub(r'^([^ ]+?) ([^ ]+?) \[(.+?)\] ', r'\2\t\3\t', text, flags=re.MULTILINE)
text = re.sub(r'([^一-鶴])([一-鶴]+)\|([一-鶴]+)', r'\1\3', text, flags=re.MULTILINE)
py = {'a1':'ā','a2':'á','a3':'ǎ','a4':'à','a5':'a','ai':'ai','ai1':'āi','ai2':'ái','ai3':'ǎi','ai4':'ài','an1':'ān','an2':'án','an3':'ǎn','an4':'àn','ang1':'āng','ang2':'áng','ang3':'ǎng','ang4':'àng','ao1':'āo','ao2':'áo','ao3':'ǎo','ao4':'ào','ei1':'ēi','ei2':'éi','ei3':'ěi','ei4':'èi','e1':'ē','e2':'é','e3':'ě','e4':'è','en1':'ēn','en2':'én','en3':'ěn','en4':'èn','eng1':'ēng','eng2':'éng','eng3':'ěng','eng4':'èng','o1':'ō','o2':'ó','o3':'ǒ','o4':'ò','ou':'ou','ou1':'ōu','ou2':'óu','ou3':'ǒu','ou4':'òu','i1':'ī','i2':'í','i3':'ǐ','i4':'ì','i5':'i','in1':'īn','in2':'ín','in3':'ǐn','in4':'ìn','ing1':'īng','ing2':'íng','ing3':'ǐng','ing4':'ìng','ian1':'iān','ian2':'ián','ian3':'iǎn','ian4':'iàn','iao1':'iāo','iao2':'iáo','iao3':'iǎo','iao4':'iào','ie1':'iē','ie2':'ié','ie3':'iě','ie4':'iè','ei4':'èi','u1':'ū','u2':'ú','u3':'ǔ','u4':'ù','er1':'ēr','er2':'ér','er3':'ěr','er4':'èr','u:1':'ǖ','u:2':'ǘ','u:3':'ǚ','u:4':'ǜ','ong1':'ōng','ong2':'óng','ong3':'ǒng','ong4':'òng','un1':'ūn','un2':'ún','un3':'ǔn','un4':'ùn','n5':'n','g5':'g','o5':'o','u5':'u','r5':'r','e5':'e'}
for i, j in py.items():
text = text.replace(i, j)
(一-鶴 это прообраз \p{Han})
Тут традиционный удаляется и всё в строку.
Правильно я понял - Py это обычный массив, ключ для поиска значение для замены найденного, а ищем пиньинь в нутрях только в скобках поcле han: han[ ] (или везде) ?
10ч dsx Правильно я понял - Py это обычный массив, ключ для поиска значение для замены найденного, а ищем пиньинь в нутрях только в скобках поcле han: han[ ] (или везде) ?
Да, примитивная глобальная замена по всему тексту.
py - pinyin
Только сейчас заметил, что в цедикте регистр у пиньиня, нужно добавить с А (и может c Е)
Цитата:'A1':'Ā','A2':'Á','A3':'Ǎ','A4':'À','A5':'A','Ai':'Ai','Ai1':'Āi','Ai2':'Ái','Ai3':'Ǎi','Ai4':'Ài','An1':'Ān','An2':'Án','An3':'Ǎn','An4':'Àn','Ang1':'Āng','Ang2':'Áng','Ang3':'Ǎng','Ang4':'Àng','Ao1':'Āo','Ao2':'Áo','Ao3':'Ǎo','Ao4':'Ào'
|