Образование

Автоматизация проверки рукописных экзаменационных работ, выявление аномалий почерка

Система автоматически отбирает подозрительные экзаменационные работы и сокращает объём ручной проверки, ускоряя обработку бланков без потери качества. ИИ помогает в оцифровке сотен тысяч бланков при помощи оптического распознавания текста (технология OCR)

ocr-documents-2.png ocr-documents.png
ocr-documents-2.png
NDA
Заказчик Эксперт на рынке российского образования, разработчик обучающих платформ и цифровых инструментов для обеспечения высокого качества образовательных и экзаменационных процессов.
Задача Сократить объём ручной проверки экзаменационных бланков за счёт автоматического выявления подозрительных работ: дописываний, смены почерка и нетипичных фрагментов, требующих экспертного контроля.
Срок 2025

О проекте

Система анализирует рукописные экзаменационные бланки на уровне отдельных фрагментов, сопоставляя их между собой внутри одной работы и между работами одного автора.

 

Для анализа используется ИИ-модель, оценивающая сходство почерка и выделяющая нетипичные участки.

 

Результат работы — разметка подозрительных зон, которые передаются на выборочную экспертную проверку.

NDA
Заказчик Эксперт на рынке российского образования, разработчик обучающих платформ и цифровых инструментов для обеспечения высокого качества образовательных и экзаменационных процессов.
Задача Сократить объём ручной проверки экзаменационных бланков за счёт автоматического выявления подозрительных работ: дописываний, смены почерка и нетипичных фрагментов, требующих экспертного контроля.
Срок 2025

97%+

точность детекции — стабильное выявление рукописных символов, включая визуально похожие
1
Формирование обучающего датасета
Сбор изображений рукописных символов с экзаменационных бланков — более 1 000 примеров на каждый символ для учёта реальной вариативности почерка.
2
Посимвольная разметка данных
Разметка каждого символа на бланках с привязкой координат и автора для корректного сравнения почерка.
3
Обучение модели анализа почерка
Обучение модели на подготовленных данных с отдельной оптимизацией для визуально похожих символов.
4
Интеграция в существующий контур проверки
Интеграция ML-модуля в систему заказчика через API с передачей результатов анализа и разметки подозрительных зон.
5
Валидация и дообучение
Тестирование на реальных экзаменационных работах и итеративная донастройка модели по результатам экспертной проверки.

Как мы учли высокую вариативность почерка

Для обучения модели использовалось более 1 000 изображений каждого рукописного символа, собранных с реальных экзаменационных бланков

Технологический стек

Frontend

Интерфейс пользователя: отчеты, графики, панели управления

Backend

Логика обработки и базовые компоненты системы

ML

Модели и фреймворки для обучения

Вызовы и решения

Визуально похожие символы при рукописном написании

Даже при наличии эталонов написания на бланках отдельные символы (например, «А» и «Д», «Б» и «6», «З» и «3») могут иметь схожую форму, что усложняет корректную интерпретацию в потоке рукописного текста.
РЕШЕНИЕ

Дополнительная логика предобработки

Для таких случаев используется контекстный анализ соседних символов и позиции в строке. Если по контексту использование цифры маловероятно, системе отдаётся приоритет буквенной интерпретации, за исключением отдельно стоящих символов (например, номеров заданий)

Трудночитаемый или частично неразборчивый почерк

В ряде работ встречаются фрагменты, где символы плохо различимы как для алгоритма, так и для эксперта из-за плотности письма, искажений или попытки уместить ответ в ограниченное пространство.
РЕШЕНИЕ

Гибридный контур OCR и экспертной проверки

Подобные случаи автоматически выделяются и передаются на дополнительную проверку специалистам. Результаты экспертной валидации используются для последующего улучшения модели, постепенно снижая долю ручного участия.

В 1,7 раза

больше экзаменационных работ проверяется за то же время

До 40%

работ исключается из полной ручной проверки

97%+

точность распознавания символов

Команда, которая внедрила проект

Алексей Цибульников
Python backend-разработчик
Дмитрий Долгин
Tech Lead
Фёдор Головин
Project Manager
Михаил Моисеев
CV-инженер
Дмитрий Соркин
DevOps-инженер
Марк Яговкин
Руководитель разметки данных

Планы на будущее:
поддержка иностранных символов, детекция аномалий почерка и анализ формул в технических предметах

Готовые проекты

Наша команда с 2017 года успешно реализовала 60 проектов с искусственным интеллектом. Тут собраны наши лучшие работы, про которые мы можем рассказать, про некоторые совсем немного, а некоторые мы вообще не можем тут упомянуть из-за NDA. Но готовы применять опыт в разработке нейросетей для ваших задач.

bracket
Разработка крупной системы
ИИ для контроля сервиса обслуживания на АЗС с окупаемостью до 12 месяцев
ai-gas-station-service-quality-control.jpg
Корпоративный ИИ
ИИ-ассистент закрывает 85–95 % рутинных административных запросов
ai-task-and-reporting-assistant.jpg
Пилотный запуск
Анализ цветового состава руды на конвейере
ai-ore-color-analysis-pilot.jpg
ИИ для промышленности
Управление разогревом и перемещением термоцистерн с помощью ИИ
pitch-tank-car-heating-optimization.jpg
ИИ для промышленности
ИИ-анализ каротажных данных скважин
ai-well-log-interpretationjpg.jpg
Разработка крупной системы
Нейросеть, которая контролирует состояние водителя, чтобы он не попал в ДТП
driver-risk-monitoring-system.jpg

Создадим проект мечты вместе

Напишите нам в Telegram о подробностях вашего проекта, и мы проведем бесплатную консультацию по автоматизации вашего бизнеса