Образование

Автоматизация проверки рукописных экзаменационных работ, выявление аномалий почерка

Система автоматически отбирает подозрительные экзаменационные работы и сокращает объём ручной проверки, ускоряя обработку бланков без потери качества. ИИ помогает в оцифровке сотен тысяч бланков при помощи оптического распознавания текста (технология OCR)

NDA

Заказчик Эксперт на рынке российского образования, разработчик обучающих платформ и цифровых инструментов для обеспечения высокого качества образовательных и экзаменационных процессов.

Задача Сократить объём ручной проверки экзаменационных бланков за счёт автоматического выявления подозрительных работ: дописываний, смены почерка и нетипичных фрагментов, требующих экспертного контроля.

Срок 2025

О проекте

Система анализирует рукописные экзаменационные бланки на уровне отдельных фрагментов, сопоставляя их между собой внутри одной работы и между работами одного автора.

Для анализа используется ИИ-модель, оценивающая сходство почерка и выделяющая нетипичные участки.

Результат работы — разметка подозрительных зон, которые передаются на выборочную экспертную проверку.

NDA

Срок 2025

97%+

точность детекции — стабильное выявление рукописных символов, включая визуально похожие

Формирование обучающего датасета

Сбор изображений рукописных символов с экзаменационных бланков — более 1 000 примеров на каждый символ для учёта реальной вариативности почерка.

Посимвольная разметка данных

Разметка каждого символа на бланках с привязкой координат и автора для корректного сравнения почерка.

Обучение модели анализа почерка

Обучение модели на подготовленных данных с отдельной оптимизацией для визуально похожих символов.

Интеграция в существующий контур проверки

Интеграция ML-модуля в систему заказчика через API с передачей результатов анализа и разметки подозрительных зон.

Валидация и дообучение

Тестирование на реальных экзаменационных работах и итеративная донастройка модели по результатам экспертной проверки.

Как мы учли высокую вариативность почерка

Для обучения модели использовалось более 1 000 изображений каждого рукописного символа, собранных с реальных экзаменационных бланков

Технологический стек

Frontend

Интерфейс пользователя: отчеты, графики, панели управления

Backend

Логика обработки и базовые компоненты системы

ML

Модели и фреймворки для обучения

Вызовы и решения

Визуально похожие символы при рукописном написании

Даже при наличии эталонов написания на бланках отдельные символы (например, «А» и «Д», «Б» и «6», «З» и «3») могут иметь схожую форму, что усложняет корректную интерпретацию в потоке рукописного текста.

РЕШЕНИЕ

Дополнительная логика предобработки

Для таких случаев используется контекстный анализ соседних символов и позиции в строке. Если по контексту использование цифры маловероятно, системе отдаётся приоритет буквенной интерпретации, за исключением отдельно стоящих символов (например, номеров заданий)

Трудночитаемый или частично неразборчивый почерк

В ряде работ встречаются фрагменты, где символы плохо различимы как для алгоритма, так и для эксперта из-за плотности письма, искажений или попытки уместить ответ в ограниченное пространство.

РЕШЕНИЕ

Гибридный контур OCR и экспертной проверки

Подобные случаи автоматически выделяются и передаются на дополнительную проверку специалистам. Результаты экспертной валидации используются для последующего улучшения модели, постепенно снижая долю ручного участия.

В 1,7 раза

больше экзаменационных работ проверяется за то же время

До 40%

работ исключается из полной ручной проверки

97%+

точность распознавания символов

Команда, которая внедрила проект

Алексей Цибульников

Python backend-разработчик

Дмитрий Долгин

Tech Lead

Фёдор Головин

Project Manager

Михаил Моисеев

CV-инженер

Дмитрий Соркин

DevOps-инженер

Марк Яговкин

Руководитель разметки данных

Планы на будущее:
поддержка иностранных символов, детекция аномалий почерка и анализ формул в технических предметах

Готовые проекты

Наша команда с 2017 года успешно реализовала 60 проектов с искусственным интеллектом. Тут собраны наши лучшие работы, про которые мы можем рассказать, про некоторые совсем немного, а некоторые мы вообще не можем тут упомянуть из-за NDA. Но готовы применять опыт в разработке нейросетей для ваших задач.