MedTech, медицина

Медицинский датасет из 500 000+ МРТ-снимков для обучения ИИ-диагностики позвоночника

Эталонный медицинский датасет МРТ позвоночника, обеспечивший обучение AI-модели с врачебной точностью и ускоривший вывод диагностического продукта на рынок.

medical-mri-dataset-for-ai (2).png medical-mri-dataset-for-ai.png
medical-mri-dataset-for-ai (2).png
NDA
Заказчик Международный MedTech-стартап, разрабатывающий систему помощи врачам-рентгенологам для анализа МРТ-снимков.
Задача Сформировать и разметить уникальный датасет из 500 000+ аксиальных и саггитальных срезов МРТ позвоночника по 4 ключевым классам. Главное требование — высочайшая точность разметки, сопоставимая с качеством работы опытного врача, для последующего обучения AI-модели.

О проекте

Для обучения медицинской AI-модели клиенту требовался крупный и медицински точный датасет МРТ позвоночника, отсутствующий в открытых источниках. Самостоятельный сбор и разметка данных оказались слишком затратными по времени и ресурсам.

Мы взяли на себя полный цикл создания датасета: от получения анонимизированных исследований до разметки и медицинской валидации. Процесс был выстроен как конвейер с участием обученной команды разметчиков и врачей-кураторов, что обеспечило стабильное качество на большом объёме данных.

В результате клиент получил готовый к обучению датасет и воспроизводимый процесс разметки, позволивший отказаться от собственного штата и ускорить вывод продукта на рынок на 9–12 месяцев.

NDA
Заказчик Международный MedTech-стартап, разрабатывающий систему помощи врачам-рентгенологам для анализа МРТ-снимков.
Задача Сформировать и разметить уникальный датасет из 500 000+ аксиальных и саггитальных срезов МРТ позвоночника по 4 ключевым классам. Главное требование — высочайшая точность разметки, сопоставимая с качеством работы опытного врача, для последующего обучения AI-модели.

87,5%

точность разметки данных в этом проекте
1
Аналитика и стратегия (1 месяц)
Провели серию консультаций с клиентом и врачами. Сформировали финальный список требований к данным, определили критерии качества и разработали методологию разметки и проверки
2
Формирование команды и обучение (2 месяца)
Привлекли и обучили команду разметчиков под руководством опытных тимлидов. Разработали и внедрили систему подробных инструкций и тестов для аттестации
3
Создание "конвейера" разметки (8 месяцев)
Запустили основной процесс: получение данных, автоматическая предобработка, ручная разметка, двухступенчатая валидация и отгрузка готовых батчей клиенту.
4
Передача датасета и документации (1 месяц)
Передали клиенту полный размеченный датасет, всю сопроводительную документацию и методологические наработки, которые могут быть использованы в их дальнейших исследованиях.

Интересные факты

Один из самых сложных классов — жировая ткань: на МРТ разных аппаратов она выглядела по-разному. Пришлось сделать отдельный визуальный гайд только по её вариациям.

 

 

 

 

Цена ошибки: неправильно размеченный межпозвоночный диск мог научить нейросеть игнорировать грыжу. Поэтому каждый спорный случай разбирался на консилиуме из 2–3 врачей.

Технологический стек

Backend

Логика обработки и базовые компоненты системы

ML

Модели и фреймворки для обучения

Вызовы и решения

Субъективность и сложность разметки

Анатомия позвоночника — сложная область. Даже у врачей могли возникать разночтения. Требовалось добиться унификации и высочайшей точности от разметчиков без медицинского образования.
РЕШЕНИЕ

Экспертное наставничество и сверхдетализированные инструкции

Мы не просто написали ТЗ. Мы привлекли практикующих рентгенологов, которые обучали наших разметчиков и создавали вместе с нами "золотой стандарт" разметки. Инструкция с гифками и разбором десятков пограничных случаев стала нашим главным инструментом для достижения качества.

Огромный объем монотонной работы

Разметка 500 000+ изображений вручную — это марафон, требующий постоянной концентрации. Риск падения качества из-за усталости и "замыливания глаз" был очень высок.
РЕШЕНИЕ

Двухступенчатая система валидации и геймификация

Мы внедрили систему, где работа каждого разметчика проверялась старшим коллегой, а ключевые и сложные снимки — врачом. Дополнительно были разработаны метрики производительности и качества, что добавило соревновательный элемент и поддерживало мотивацию команды.

15% снимков

мы отбраковали, т.к. даже опытный врач на них не смог идентифицировать все классы

500 000+

Снимков МРТ размечено и валидировано

12 месяцев

занял полный цикл работ, сэкономив клиенту год R&D

Команда, которая внедрила проект

Марк Яговкин
Руководитель разметки данных
Роман Фёдоров
Бизнес-аналитик

Проект запущен в работу

Скоро здесь будут

обновления

Готовые проекты

Наша команда с 2017 года успешно реализовала 60 проектов с искусственным интеллектом. Тут собраны наши лучшие работы, про которые мы можем рассказать, про некоторые совсем немного, а некоторые мы вообще не можем тут упомянуть из-за NDA. Но готовы применять опыт в разработке нейросетей для ваших задач.

bracket
Пилотный запуск
Интеллектуальная видеоаналитика для контроля периметра, выявления угроз на интроскопах и БПЛА
ai-video-security-industrial-sites.jpg
Разработка крупной системы
AI-агент для первой линии обращений жильцов многоквартирных домов
ai-assistant-resident-support-2.jpg
Разработка крупной системы
ИИ для контроля сервиса обслуживания на АЗС с окупаемостью до 12 месяцев
ai-gas-station-service-quality-control.jpg
Корпоративный ИИ
ИИ-ассистент закрывает 85–95 % рутинных административных запросов
ai-task-and-reporting-assistant.jpg
Пилотный запуск
Анализ цветового состава руды на конвейере
ai-ore-color-analysis-pilot.jpg
ИИ для промышленности
Управление разогревом и перемещением термоцистерн с помощью ИИ
pitch-tank-car-heating-optimization.jpg

Создадим проект мечты вместе

Напишите нам в Telegram о подробностях вашего проекта, и мы проведем бесплатную консультацию по автоматизации вашего бизнеса