Страницы (2): « Предыдущая 1 2
11
2018.03.29бкрс Если альтов немного - в ручную копировать, а если много регуляркой (напр. удалить все нерусские символы). Если не знаете что это, можете скинуть, делается за секунду.

Достаточно сохранить текст html файла в кодировках utf-8 и cp1251 (такая возможность есть в любом редакторе типа notepad++), а затем вычесть из размера первого в байтах размер второго. Как раз получится число русскоязычных символов (ибо они имеет вид двухбайтовых в utf-8 и однобайтовых в cp1251)
2018.03.29
Ответить
12
2018.03.29Kain Можно попробовать сохранить как .html и оттуда дернуть текст, нет?

Не получится. Надписи у тега "alt" - это то, что должно всплывать при наведении мышкой на нужное место экрана, т.е. в тексте на экране это просто так отображаться не будет. Поэтому только удалять нерусские символы, как посоветовали ранее.
2018.03.29
Ответить
13
Консоль разработчика для чего? Гайс слишком лёгкий вопрос
2018.03.30
Ответить
14
2018.03.29Рейхсканцлер Достаточно сохранить текст html файла в кодировках utf-8 и cp1251 (такая возможность есть в любом редакторе типа notepad++), а затем вычесть из размера первого в байтах размер второго. Как раз получится число русскоязычных символов (ибо они имеет вид двухбайтовых в utf-8 и однобайтовых в cp1251)
Интересный способ (надо только убедиться в точности, т.к. в файле могут быть какие угодно символы), но для данного случая скорее теоретический (для задачи "придумайте 5 разных способов").

Надо ещё пробелы сохранить, для подсчёта, да и просто использования текста для перевода.

Т.е. удаляем всё нерусское кроме пробелов, удаляем лишние пробелы (наложение и по краям) - и готовенький список.
Если нужны знаки препинания, то ещё одна замена.

Хотя вряд ли обычные переводчики владеют регулярками, даже простыми. И зря, это мана небесная для работы с текстами, да и просто очень интересно, магия.
2018.03.30
Ответить
15
2018.03.30бкрс Хотя вряд ли обычные переводчики владеют регулярками, даже простыми. И зря, это мана небесная для работы с текстами, да и просто очень интересно, магия.

Да, согласен, без регулярных выражений вообще плохо. Кстати, для сложного форматирования html есть еще магия синтаксиса xpath / xslt, это тоже, если привыкнуть, очень сильная вещь.
2018.03.30
Ответить
16
2018.03.30Колес Консоль разработчика для чего? Гайс слишком лёгкий вопрос

Это если эта Консоль вообще есть, встречал много старых сайтов деланных на коленках, там нет личного кабинета, вот те код ковыряй страницу.))
Asia Pacific ИНТЕРНЕТ-МАРКЕТИНГ В АЗИИ
telegram @asia_pacific
info@as-pacific.com
http://www.as-pacific.com
2018.07.09
Ответить
Страницы (2): « Предыдущая 1 2