Как перевести текст с картинки по фото: лучшие сервисы

Перевести текст с картинки
iStock
  1. Что такое системы OCR и где они используются
  2. Лучшие бесплатные переводчики текста по фото на ПК
  3. Лучшие бесплатные переводчики текста по фото с телефона
  4. Профессиональные OCR-системы
  5. Какую программу выбрать

Что такое системы OCR и где они используются

В повседневной жизни мы часто имеем дело с информацией, представленной на фотографиях и сканах. Ручное перепечатывание больших текстов для перевода, редактирования или заполнения форм отнимает много времени и несет риск ошибок. Для удобной и быстрой оцифровки можно воспользоваться технологиями OCR. Специалист в области компьютерного зрения, генеральный директор Smart Engines Владимир Арлазаров помог разобраться, как работает технология оптического распознавания символов, и какие инструменты подходят лучше всего.

OCR (оптическое распознавание символов) - это технология компьютерного зрения, которая автоматически извлекает текст с изображений и переводит его в редактируемый цифровой формат.

Технологии распознавания символов делятся на бытовые и профессиональные:

  • Бытовые используются в повседневных ситуациях (например, когда нужно перевести текст на фото или скопировать информацию со скана документа). Система обнаруживает текст на изображении, распознает и предоставляет данные в текстовом формате, который затем может быть скопирован, отредактирован или сохранен;
  • Профессиональные необходимы для качественной работы с определенными типами документов и с большими объемами информации, автоматизации ввода данных и повышения производительности. Некоторые из промышленных систем распознавания позволяют работать не только с фотографиями и сканами, но и с видеопотоком. На сегодняшний день такие технологии распознавания применяются в государственных ведомствах, банках, телекоме, промышленности и бизнесе.

"В области качества и точности бесплатные приложения для распознавания текста на отсканированных документах уже давно сравнимы с показателями профессиональных систем. Поэтому основные преимущества промышленных OCR-технологий перед бытовыми - это распознавание документов на фотографиях низкого качества, распознавание документов со сложным фоном, распознавание реквизитов в документе, а также возможность интеграции в другие приложения", - сказал Арлазаров.

Современный человек пользуется промышленными технологиями OCR, например, во время сканирования паспорта для открытия счета в банке, регистрации в приложении ФНС для самозанятых, при пересечении государственной границы посредством автогейтов в московских аэропортах и в процессе подтверждения личности по видеоселфи. В бизнесе же сценарии использования таких систем включают извлечение данных из первичных бухгалтерских документов, кадровых документов, анкет, заявлений, договоров и других документов, добавил эксперт.

Лучшие бесплатные переводчики текста по фото на ПК

Рассмотрим лучшие приложения с технологией OCR, которые распознают символы на фото, для компьютера. Каждый из них проверим на одном и том же изображении - скриншоте новостной заметки из китайского СМИ.

Google Переводчик

Как пользоваться Google Переводчик:

1. В верхней левой части экрана кликаем на кнопку "Изображения";

Главная страница Google Переводчика
Фото: Юлия Гуреева/РГ

2. В правой части экрана выбираем язык, на котором написан текст (в нашем случае китайский), а в левой - на какой язык его нужно перевести;

Выбор языков в Google Переводчике
Фото: Юлия Гуреева/РГ

3. Добавляем файл: перетаскиваем (например, с рабочего стола), выбираем уже загруженное на компьютер фото или вставляем его из буфера обмена;

Добавление фото в Google Переводчике
Фото: Юлия Гуреева/РГ

4. Получился такой перевод.

Переведенный Google Переводчиком текст
Фото: Юлия Гуреева/РГ

Плюсы Google Переводчик:

  • Бесплатный доступ ко всем функциям;
  • Работает на ПК, смартфоне и в браузере;
  • Поддерживает более 240 языков, включая редкие.

Минусы Google Переводчик:

  • Нет офлайн-режима для работы с изображениями;
  • Распознавание может быть неточным, если текст на изображении мелкий, а сама картинка недостаточно четкая.

Яндекс Переводчик

Инструкция по использованию Яндекс Переводчика:

1. В левой части экрана кликаем на "Картинки";

Главная страница Яндекс Переводчика
Фото: Юлия Гуреева/РГ

2. Выбираем нужные языки, после чего перетаскиваем в специальное окно нужное изображение или выбираем его вручную;

Выбор языков и фото в Яндекс Переводчике
Фото: Юлия Гуреева/РГ

3. Система перевела текст так.

Переведенный Яндекс Переводчиком текст
Фото: Юлия Гуреева/РГ

Плюсы Яндекс Переводчика:

  • Поддержка более 100 языков;
  • Скорость перевода;
  • Возможность сохранять переводы в формате PDF или TXT.

Минусы Яндекс Переводчика:

  • Качество распознавания падает, если текст на картинке плохого качества;
  • Может ошибаться в специфических терминах.

Img2txt

Инструкция по использованию Img2txt:

1. На главной странице добавляем файл в соответствующее окно, выбираем язык текста и нажимаем на "Загрузить";

Главная страница Img2txt
Фото: Юлия Гуреева/РГ

2. В правой части экрана кликаем на кнопку "Перевести текст";

Перевод текста в Img2txt
Фото: Юлия Гуреева/РГ

3. После этого программа переведет текст.

Переведенный Img2txt текст
Фото: Юлия Гуреева/РГ

Плюсы Img2txt:

  • Не нужна регистрация, бесплатный доступ;
  • Нет лимитов на количество операций;
  • Есть интеграция с сервисами Google.

Минусы Img2txt:

  • Нельзя загружать более 8 Мб;
  • Могут возникать ошибки, если в тексте есть мелкие или плохо пропечатанные буквы.

Лучшие бесплатные переводчики текста по фото с телефона

Рассказываем, какие мобильные приложения с OCR можно использовать на смартфоне.

DeepL

Шаги для перевода текста с фото в DeepL

1. Определяем языки в нижней части экрана;

Главная страница DeepL
Фото: Юлия Гуреева/РГ

2. Добавляем фото или делаем снимок прямо с телефона;

Добавление фото в DeepL
Фото: Юлия Гуреева/РГ

3. Кликаем на кнопку "Выделить весь текст";

Перевод текста в DeepL
Фото: Юлия Гуреева/РГ

4. Получился следующий перевод.

Переведенный в DeepL текст
Фото: Юлия Гуреева/РГ

Плюсы DeepL:

  • Поддержка языков постоянно расширяется;
  • Простой интерфейс;
  • Возможность настраивать глоссарий.

Минусы DeepL:

  • Отсутствует офлайн-режим;
  • Нет перевода рукописного текста.

Microsoft Translator

Для того, чтобы перевести текст на фото через Microsoft Translator, выполняем следующие шаги:

1. Выбираем язык исходного текста и язык, на который нужно перевести, а потом кликаем на значок фотоаппарата;

Главная страница Microsoft Translator
Фото: Юлия Гуреева/РГ

2. Приложение сделало такой перевод.

Переведенный в Microsoft Translator текст
Фото: Юлия Гуреева/РГ

Плюсы Microsoft Translator:

  • Может переводить не только тексты, но и речь в реальном времени;
  • Есть офлайн-режим;
  • Разработчики обещают безопасное использование сервиса.

Минусы Microsoft Translator:

  • Не всегда переводит региональные диалекты;
  • Для использования некоторых функций требуется подключение к интернету.

Sider

Рассказываем, как работать с Sider:

1. Кликаем на значок "+" рядом с диалоговым окном;

Главная страница Sider
Фото: Юлия Гуреева/РГ

2. В нижней части экрана выбираем фото из галереи или делаем снимок со смартфона;

Добавление фото в Sider
Фото: Юлия Гуреева/РГ

3. Появится окно, в котором следует нажать на кнопку "Извлечь текст";

Извлечение текста в Sider
Фото: Юлия Гуреева/РГ

4. Ждем, когда система извлечет текст, и в диалоге с чат-ботом пишем "Переведи текст";

Диалог с чат-ботом в Sider
Фото: Юлия Гуреева/РГ

5. Ждем перевода. Такой текст у нас получился.

Переведенный в Sider текст
Фото: Юлия Гуреева/РГ

Naver Papago Translate

Разбираемся, как работать с Naver Papago Translate:

1. В верхней части экрана выбираем нужные языки;

Выбор языков в Sider
Фото: Юлия Гуреева/РГ

2. Нажимаем на кнопку "Картина" внизу экрана, после чего делаем снимок или выбираем уже имеющееся изображение;

Добавление фото в Sider
Фото: Юлия Гуреева/РГ

3. В результате у нас получился такой текст.

Переведенный в Sider текст
Фото: Юлия Гуреева/РГ

Плюсы Naver Papago Translate:

  • Простой интерфейс;
  • Есть офлайн-доступ к приложению;
  • Может переводить текст и речь.

Минусы Naver Papago Translate:

  • Ограниченные функции;
  • Приложение в большей степени акцентируется на азиатских языках.

Профессиональные OCR-системы

Промышленные технологии OCR отличаются повышенными требованиями к безопасности распознавания и возможностям интеграции в разные информационные архитектуры. Ниже представлен список наиболее популярных решений.

Tesseract

Плюсы:

  • Бесплатный и открытый исходный код, который можно модифицировать под свои нужды;
  • Поддержка более 100 языков;
  • Активное сообщество, регулярные обновления и поддержка.

Минусы:

  • Низкокачественные или искаженные изображения снижают точность распознавания;
  • Плохо обрабатывает таблицы, колонки, сложные структуры.

Smart Engines

Плюсы:

  • Точное распознавание печатного и рукописного текста на сканах и фотографиях низкого качества;
  • Распознавание занимает менее секунды. Работает оффлайн, изображение не передается на внешний сервер;
  • Широкие возможности для интеграции.

Минусы:

  • Коммерческая лицензия для корпоративного использования;
  • Интеграция требует навыков программирования.

Google Cloud Vision API

Плюсы:

  • Распознавание даже в сложных макетах;
  • Поддержка редких языков и символов;
  • Обработка структурированных данных.

Минусы:

  • Не подходит для оффлайн-среды;
  • Данные хранятся на серверах Google, что может нарушать внутренние политики безопасности компаний.

Какую программу выбрать

Для бытовых задач, например, перевода меню в кафе и вывесок больше подойдет Яндекс переводчик.

Для работы на личном устройстве - Microsoft Translator.

В качестве профессиональной OCR лучше выбрать Smart Engines OCR.

"Перед выбором проверьте язык, формат файлов и необходимость редактирования. Также большинство сервисов предлагают демо-версии - их можно использовать для теста", - посоветовал Арлазаров.