Сбор датасета для детекции агрессивного поведения и драк
Мы организовали съёмки в двух регионах, чтобы собрать качественный видеодатасет для обучения ИИ детекции драк.


О проекте
Для обучения сложных моделей компьютерного зрения, таких как детектор драк, требуются специфические и высококачественные данные. Видео из открытых источников (YouTube, новостные сводки) не подходят из-за низкого разрешения, неподходящих ракурсов и юридических ограничений. Когда готовых данных нет, единственный путь — создать их.
Наш клиент, мировой лидер в CV, столкнулся именно с такой задачей. Для их новой системы безопасности требовался датасет, который невозможно было найти или купить. Нужны были реалистичные, постановочные сцены, снятые с ракурса уличных камер наблюдения.
Мы организовали полный цикл производства синтетических данных: от разработки сценариев и подбора актеров до съемок в различных условиях и финальной передачи материала. Этот проект — яркий пример того, как правильная организация и готовность к "полевой" работе решают самые амбициозные задачи в области сбора данных для ИИ.
100% видеоматериала принято
Тестовый этап и валидация требований
Проект начался с тестовых съёмок, позволивших синхронизировать ожидания с заказчиком, выявить риски по качеству данных и уточнить требования к реализму, бюджету и срокам до масштабирования работ.Планирование съёмок и логистика
Для выполнения проекта в сжатые сроки были сформированы две съёмочные команды в разных регионах (Москва и Краснодар). Сценарии съёмок, локации, тайминги и требования к вариативности данных были зафиксированы в едином рабочем плане.Формирование актерского состава
В Москве в съёмках участвовали сотрудники компании. В Краснодаре, для повышения реалистичности сложных сцен (формат 3×3), были привлечены участники бойцовского клуба, что обеспечило необходимый уровень достоверности данных.Первичная съёмка и контроль качества
Съёмки проводились в разное время суток для обеспечения вариативности освещения. По результатам внутренней и внешней оценки было выявлено несоответствие части материала требованиям по реализму — 66% видео не прошли приёмку заказчиком.Корректировка подхода и повторные съёмки
На основе обратной связи была изменена стратегия: весь объём повторных съёмок передан команде, продемонстрировавшей наилучшее качество.

Интересные факты
Вызовы и решения
Недостаточный реализм и брак 66% материала.
Гипотеза о том, что для съёмок будет достаточно штатных сотрудников, не подтвердилась. Контраст между «офисными» и «бойцовскими» сценами оказался слишком заметным, и заказчик обоснованно отказался принимать большую часть материала.Гибкость и фокус на качестве
Мы не стали спорить или «дотягивать» слабый результат. Проблему признали, причину разобрали и оперативно перераспределили съёмки в пользу команды, показавшей лучший результат. Это позволило быстро выйти на нужное качество и сохранить доверие заказчика.Организационные сложности в полевых условиях
Проект сопровождался типичными для съёмок «на земле» ситуациями: от требований согласовывать каждый ракурс до неявки актёров и конфликтов с жителями локаций.Проактивное управление и сильные команды на местах.
Мы решали вопросы по ходу проекта: заранее фиксировали ракурсы, оперативно находили замену участникам и снимали организационные напряжения на локациях. Этот опыт показал, что успешный сбор данных — это не только технологии, но и умение работать с людьми.300 уникальных видео
создано с нуля
2 команды
в разных городах для ускорения процесса
на 100%
клиент доволен финальным результатом
Команда, которая внедрила проект
Роман Фёдоров
Бизнес-аналитик
Марк Яговкин
Руководитель разметки данных
Проект запущен
в работу
Скоро
здесь будут
обновления

Готовые проекты
Наша команда с 2017 года успешно реализовала 60 проектов с искусственным интеллектом. Тут собраны наши лучшие работы, про которые мы можем рассказать, про некоторые совсем немного, а некоторые мы вообще не можем тут упомянуть из-за NDA. Но готовы применять опыт в разработке нейросетей для ваших задач.

































