Хорошие сайты для перевода текстов

美人鱼

Ну вот попробовала Small PDF ради интереса на паре рандомных файлов:
Your file seems to be a scan and its text can't be recognised by a computer. You need a special software for text recognition (OCR).

Продолжаю экспериментировать. Хотят OCR, загрузила эти файлы в onlineocr.
Файл на русском местами распознался так: статья УГОЛОВНОГО ЗдКОНЗ, дата И ОСНОВЗНИЕ, ё;,‚‚ гг выданных справок
Китайский местами распознался так: 璇L盒灬 o o o 鹏施朐H蒯

Всё форматирование утрачено, а это значит, что после перевода надо будет выравнивать текст и вставлять таблицы.

Результат - время потрачено, приемлемый для смартката материал не получен.

А у вас всё гладко конвертируется? Я как бы без иронии. Я была бы рада, если смогла чаще пользоваться смартом. Думаю, что за этим будущее переводов.

美人鱼

Попробовала FineReader. Результат намного лучше, но не 100%. Буква Ж вместо 双, появились какие-то дополнительные точки и знаки вопроса, номера контрактов, контейнеров и накладных из букв и цифр распознались полной белибердой. С этим же невозможно работать

Рейхсканцлер

2018.02.03美人鱼 Попробовала FineReader. Результат намного лучше, но не 100%. Буква Ж вместо 双, появились какие-то дополнительные точки и знаки вопроса, номера контрактов, контейнеров и накладных из букв и цифр распознались полной белибердой. С этим же невозможно работать

Файнридеру (если речь о полноценном софте, а не онлайн сервисах) можно помочь: выбрать точный язык распознавания (запретив ему вообще искать что-то русское); на проблемных страницах выделить явно области, подлежащие распознаванию; явно подсказать язык для каждой области (например, где номера накладных - там выставить русский+английский, где сам текст - там выставить китайский); запретить искать доп.элементы оформления (всякие сноски); включить режим самообучения и т.д. Довольно гибкий софт, попробуйте его ещё немного поприручить. Причем от версии к версии возможностей настроить его "под себя" все больше.

Онлайн распознавание (https://finereaderonline.com) тоже уже вполне прилично работает, простые pdf документы на китайском кушает хорошо. Но в более сложных случаях лучше стационарный софт.

snum23

2018.02.03美人鱼 А у вас всё гладко конвертируется? Я как бы без иронии. Я была бы рада, если смогла чаще пользоваться смартом. Думаю, что за этим будущее переводов.

конечно, не все гладко)
если бы программы распознавали все как человек, то цены бы им не было) многие файлы туда просто бестолку совать

чаще если нужно что-то такое перевести быстро, то мы делаем запрос прислать в доке, если кривой пдф, то стоимость работы увеличивается (прилично)

Siweida

Мне кажется, от версии зависит. У меня Файнридер вполне прилично и китайский, и русский, и английский текст распознает, и даже смешанный. Иногда Файнридеру вообще цены нет, когда надо какие-нибудь накладные перевести, где огромная страшная нелогично созданная таблица (что в экселе, что в ворде замучаешься чертить), а текста - кот наплакал. Вот тут очень выручает, прогонишь через Файнридер - вот тебе и таблица, и текст. Текст перевел уже в таблице - и все готово.

g1007

2018.02.03美人鱼 Попробовала FineReader. Результат намного лучше, но не 100%. Буква Ж вместо 双, появились какие-то дополнительные точки и знаки вопроса....

Обратите внимание ещё на качество присылаемого скана!

Многие секретарши, маркетологши и др. офисный планктон (кто задания переводчикам раздаёт) и им подобные офисные особы бывают нередко совершенно неграмонты в этом плане и присылают еле видные, кривые и неаккуратные сканы. Я лично заставляю себя уважать и беречь зрение тех, кому отсылаю сканированные документы! Настроил сканер так, чтобы видно было чётко, где надо - добавил яркости и контраста, где не надо - убавил. Был как-то плохой картридж, который после перезарядки печатал очень бледно (лазерный принтер 3 в одном) - он полетел в мусорную корзину и был заказан новый. Пока не был заказан новый, на принтере был выставлен максимально яркий отпечаток для печати (или как этот параметр там называется 加深). Если важные бумаги, а исходник был отпечатан на принтере с плохим картриджем, нечётко (скажем, справку в налоговой такую выдали, еле видно чего на ней), то ещё и прогоняю через ACDSee, делая документы чётче и убирая шум - серые облачка по всему листу, которые часто получаются когда сканируешь мятый лист. Края листа нередко имеют характерню черноту - обрезаю в той же ACDSee. Это действие уже занимает время, но делал так даже сканированные книги, которые выкладывал на twirpx, и о потраченном на это времени не жалею! Если документ был со скрепкой, то нередко скрепку вынимаю - это действие занимает пару десятков секунд - и после сканирования опять скрепляю, зато скан намного качественней, чем перегнутые через скреплённое место листы.

Что касается перевода сканированных документов, то, поскольку у меня объёмы маленькие, часто делаю это и без набивки текста вовсе, либо набиваю лишь частично, какой-то сложный малопонятный кусок. Открываем pdf, jpg или в чём оно там, на весь экран, затем открываем окошко Notepad (немного удобнее его заменитель - Akelpad), и вуаля. Прямо в блокноте пишем перевод сразу на русском, китайском или английском. Форматирование, стили и шрифт не мешают, в глазах не рябит, т.к. в блокноте всего этого и нет. И так строчку за строчкой, концентрируясь лишь на самом переводе. Мне это показалось более удобным, чем пытаться раскладывать окна в ворде - у меня этот метод не прижился. Тем более, что метод с помощью блокнота позволяет не обращать внимание на формат источника - лишь бы открывался. И убивает форматирование, из-за которого нередко в вордах и экселях всё расползается как попало и становится неаккуратным и разноцветным. А затем из блокнота Ctlr+A - копируем одним махом всё, или частями (если для экселя) и вставляем куда надо - в ворд, в почтовый клиент, в эксель и т.д. Бывают трудные сложные фразы. Тогда их набиваю в блокноте или копирую туда, если исходник текстовый. И уже под ними перевод. После перевода их стираю. Что ещё радует - это файлы txt открываются быстро на любой, даже самой древней (по нынешним меркам) машине, и даже при отсутствии офисного пакета.

А как Вы обычно располагаете файлы и документы на компьютере, когда переводите?

美人鱼

2018.02.04g1007 А как Вы обычно располагаете файлы и документы на компьютере, когда переводите?

Я что-то распечатываю, декларации, например.
Или через принт скрин и Paint вырезаю из пдф куски текста, вставляю их в ворд и так перевожу один за другим.

Кстати в самом смарткате за небольшую денежку есть функция преобразования графических файлов в текстовые. Кто-нибудь пользовался? Может, проще и дешевле там заплатить, чем покупать файнридер?

dima_depressor

2018.02.02Келейник Почему грустный смайл? наверно, стоит порадоваться. Как только машинерия лучше человека будет справляться, без работы можно легко остаться..

Никогда этого не будет при нынешней архитектуре компов. Ни через 10 лет, ни через 100. Пока машины не будут способны к творчеству (а они бесконечно далеки от этого) - о каком-либо серьёзном машинном переводе даже речи идти не может, это какие-то дикие фантазии.

2018.02.04dima_depressor Пока машины не будут способны к творчеству

Та ви шо! Какое, нахрен, творчество в техническом, а уж, тем более, бизнес-переводе?
Разве что для говнотранслейта в стиле "ваших терминов не знаю и грамматики не знаю, но щас вам тут насочиняю"?

dima_depressor

2018.02.04Йосы Та ви шо! Какое, нахрен, творчество в техническом, а уж, тем более, бизнес-переводе?
Разве что для говнотранслейта в стиле "ваших терминов не знаю и грамматики не знаю, но щас вам тут насочиняю"?

Художественный перевод куда-то пропал? И да, даже в таких видах перевода используется ЧЕЛОВЕЧЕСКОЕ гибкое мышление, а не говногуглтранслэйт с такими же ограниченными говноалгоритмами или нейросетями. Те же технари могут сколь угодно понимать, о чём речь, но переводчики из них дерьмовые как правило (если сами язык не учили). И они же сотню лет сочиняют сказки про то как роботы заменят переводчиков, хотя не имеют малейшего представления о процессе перевода. Для таких людей перевод - это тупое машинное подставление слов и фраз на нужные места, то есть отрицательные последствия технарского мышления. Алгоритмизация сферы перевода - худшее, что может случиться с этой сферой.