Автоматизация проверки рукописных экзаменационных работ, выявление аномалий почерка
Система автоматически отбирает подозрительные экзаменационные работы и сокращает объём ручной проверки, ускоряя обработку бланков без потери качества. ИИ помогает в оцифровке сотен тысяч бланков при помощи оптического распознавания текста (технология OCR)


О проекте
Система анализирует рукописные экзаменационные бланки на уровне отдельных фрагментов, сопоставляя их между собой внутри одной работы и между работами одного автора.
Для анализа используется ИИ-модель, оценивающая сходство почерка и выделяющая нетипичные участки.
Результат работы — разметка подозрительных зон, которые передаются на выборочную экспертную проверку.
97%+
Формирование обучающего датасета
Сбор изображений рукописных символов с экзаменационных бланков — более 1 000 примеров на каждый символ для учёта реальной вариативности почерка.Посимвольная разметка данных
Разметка каждого символа на бланках с привязкой координат и автора для корректного сравнения почерка.Обучение модели анализа почерка
Обучение модели на подготовленных данных с отдельной оптимизацией для визуально похожих символов.Интеграция в существующий контур проверки
Интеграция ML-модуля в систему заказчика через API с передачей результатов анализа и разметки подозрительных зон.Валидация и дообучение
Тестирование на реальных экзаменационных работах и итеративная донастройка модели по результатам экспертной проверки.Как мы учли высокую вариативность почерка
Технологический стек
Frontend
Интерфейс пользователя: отчеты, графики, панели управленияBackend
Логика обработки и базовые компоненты системыML
Модели и фреймворки для обученияВызовы и решения
Визуально похожие символы при рукописном написании
Даже при наличии эталонов написания на бланках отдельные символы (например, «А» и «Д», «Б» и «6», «З» и «3») могут иметь схожую форму, что усложняет корректную интерпретацию в потоке рукописного текста.Дополнительная логика предобработки
Для таких случаев используется контекстный анализ соседних символов и позиции в строке. Если по контексту использование цифры маловероятно, системе отдаётся приоритет буквенной интерпретации, за исключением отдельно стоящих символов (например, номеров заданий)Трудночитаемый или частично неразборчивый почерк
В ряде работ встречаются фрагменты, где символы плохо различимы как для алгоритма, так и для эксперта из-за плотности письма, искажений или попытки уместить ответ в ограниченное пространство.Гибридный контур OCR и экспертной проверки
Подобные случаи автоматически выделяются и передаются на дополнительную проверку специалистам. Результаты экспертной валидации используются для последующего улучшения модели, постепенно снижая долю ручного участия.В 1,7 раза
больше экзаменационных работ проверяется за то же время
До 40%
работ исключается из полной ручной проверки
97%+
точность распознавания символов
Команда, которая внедрила проект
Алексей Цибульников
Python backend-разработчик
Дмитрий Долгин
Tech Lead
Фёдор Головин
Project Manager
Михаил Моисеев
CV-инженер
Дмитрий Соркин
DevOps-инженер
Марк Яговкин
Руководитель разметки данных
Планы на будущее:
поддержка иностранных символов, детекция аномалий почерка и анализ формул в технических предметах
Готовые проекты
Наша команда с 2017 года успешно реализовала 60 проектов с искусственным интеллектом. Тут собраны наши лучшие работы, про которые мы можем рассказать, про некоторые совсем немного, а некоторые мы вообще не можем тут упомянуть из-за NDA. Но готовы применять опыт в разработке нейросетей для ваших задач.











































