Редактор ОнлайнРедактор Онлайн
Назад к блогу
8 апреля 2024
10 мин чтения
Гайд

OCR — распознавание текста: полное руководство 2025 (русский и английский)

OCR (Optical Character Recognition, оптическое распознавание символов) превращает картинку с текстом в редактируемый текст. Это технология, которая позволяет «оцифровать» бумажный архив, скопировать цитату из скана учебника или сделать PDF поисковым. Эта статья — практическое руководство, как пользоваться OCR в браузере и как добиться хорошей точности.

Главное про OCR в нашем сервисе

OCR работает в браузере через Tesseract.js — это значит, ваши изображения не покидают ваш компьютер. Никакой нужды в премиум-подписке, никаких лимитов по количеству распознаваний.

Когда нужен OCR

  • Скан учебника или книги → редактируемый текст для конспекта.
  • Фотография договора → возможность скопировать конкретный пункт.
  • Архив бумажных документов → поиск по содержимому через стандартный Ctrl+F.
  • Чек или квитанция → быстрое извлечение цифр для бухгалтерии.
  • Старые рукописные записи → сохранение в цифровом виде (с оговоркой про точность).
  • PDF-скан без текстового слоя → подготовка к конвертации в Word.

Как использовать OCR на нашем сайте

Шаг 1. Откройте инструмент

Перейдите на страницу OCR — распознавание текста. Никаких регистраций, и важно — все вычисления происходят в вашем браузере.

Шаг 2. Загрузите изображение или PDF

Поддерживаются JPG, PNG, WEBP, а также PDF (распознаётся постранично). Лучшее качество — на оригинальных сканах в 300 DPI. Хорошие фотографии с телефона тоже подходят.

Шаг 3. Выберите язык

Русский — для русского текста. Английский — для английского. Смешанный (rus+eng) — если в тексте чередуются языки (типично для технической документации). Указание правильного языка повышает точность на 5–15 %.

Шаг 4. Дождитесь обработки

Первый запуск может занять 5–10 секунд — браузер загружает языковую модель Tesseract (~10–20 МБ). Дальше распознавание идёт за 2–5 секунд на страницу.

Шаг 5. Скопируйте результат

Распознанный текст появится в окне. Используйте кнопку «Скопировать» или выделите мышкой и Ctrl+C.

Как добиться высокой точности

  • Разрешение 300 DPI и выше. Меньше — буквы становятся кашей пикселей.
  • Прямой угол съёмки. Любой наклон искажает буквы. Если фотографируете телефоном — снимайте сверху, перпендикулярно странице.
  • Хорошее освещение. Дневной свет лучше лампы накаливания. Избегайте бликов и теней.
  • Высокий контраст. Чёрный текст на белом — идеал. Серый на сером — почти нераспознаваемо.
  • Без шума. Помятая бумага, кофейные пятна, бледные надписи поверх — всё это снижает точность.
  • Один язык за раз. Если страница на русском, не выбирайте «английский». Если смешанный — берите rus+eng явно.

Распространённые ошибки

  • Загрузка фото из мессенджера (там обычно 80–100 DPI — мало).
  • Скан на цветном или текстурном фоне (Tesseract путает фон с текстом).
  • Снимок «на бегу» с заметным размытием — буквы сливаются.
  • Распознавание сверхмаленького шрифта (мелкие сноски, мелкий шрифт договора).

Что делать с результатом

  • Отредактировать в Word — открой Умный редактор и попроси ИИ форматировать текст или составить документ на его основе.
  • Сделать PDF поисковым — сохранить распознанный текст и присоединить его как невидимый слой к исходному PDF.
  • Конвертировать в DOCX для редактирования в офлайне — через «PDF в Word» после OCR.
  • Перевести в Google Translate / DeepL — теперь, когда текст извлечён, это занимает секунды.

Как работает OCR под капотом

  1. Препроцессинг. Изображение приводится к чёрно-белому, удаляются шум и дефекты, выравнивается наклон.
  2. Сегментация. Алгоритм находит области, похожие на текст, и отделяет их от изображений.
  3. Разбиение на строки и слова. Каждая строка делится на отдельные слова по пробелам.
  4. Классификация символов. Нейросеть (LSTM в Tesseract 4+) сопоставляет картинку каждого символа с буквой алфавита.
  5. Постобработка. Словарная проверка корректирует ошибки («пр0блема» → «проблема»).

Ограничения OCR

  • Сложные шрифты: декоративные, готические — точность падает до 70–80 %.
  • Математические формулы: распознаются плохо, нужна спец-OCR (например, Mathpix).
  • Нестандартные таблицы: строки/колонки распознаются как линейный текст. Структура теряется.
  • Печати и штампы: часто принимаются за «шум» и игнорируются.
  • Многоязычные надписи в один проход распознаются хуже, чем моноязычные.

Часто задаваемые вопросы

Какая точность распознавания у современного OCR?

На печатном тексте хорошего качества (300+ DPI, ровно сфотографирован, без наклона) — 95–99 %. На фотографиях с телефона при хорошем освещении — 90–97 %. На рукописном тексте — 60–80 %, и сильно зависит от почерка.

Распознаёт ли OCR рукописный текст?

Tesseract распознаёт каллиграфический рукописный текст с переменным успехом, обычный «беглый» почерк — плохо. Для серьёзной работы с рукописями лучше использовать специализированные платные сервисы (Google Cloud Vision, Microsoft Read API) — у них модели обучены отдельно на рукописи.

Уходят ли мои сканы на сервер при использовании OCR?

В нашем OCR-инструменте — нет. Tesseract.js работает в WebAssembly прямо в браузере, изображение остаётся на вашем устройстве. Это особенно важно для сканов паспортов, договоров и медицинских документов.

Какие языки поддерживаются?

На нашем сервисе — русский, английский и смешанный режим (rus+eng). Tesseract в принципе поддерживает 100+ языков, но мы загружаем только нужные модели для скорости. Если нужен украинский, белорусский, немецкий — напишите, добавим.

OCR не справился — что делать?

Самые частые причины: низкое разрешение (увеличьте до 300 DPI), наклон страницы (выпрямите в любом редакторе), плохой контраст (увеличьте контрастность, можно перевести в чёрно-белый), сложный фон (попробуйте обрезать только текстовую область).

Связанные инструменты и статьи

Распознать текст из вашего скана

Бесплатно, в браузере, без отправки на сервер. Русский, английский и смешанный.

Открыть инструмент