Итак, вы решили собрать датасет для ML-модели и отдать его на разметку подрядчику. Вы получаете коммерческое предложение и видите итоговую цифру. Но как понять, что она взята не «с потолка»? Почему разметка обычных фото стоит в разы дешевле, чем аннотирование медицинских снимков или аудиофайлов?
В NeuroCore мы считаем, что клиент должен понимать, за что он платит. В этой статье мы раскроем внутреннюю «кухню» оценки проектов по разметке данных, объясним, из чего складывается экономика, и покажем подводные камни для каждого типа задач.
Фундамент любой оценки: «Золотая формула» экономики проекта
В основе расчета стоимости 99% проектов по разметке лежит простая и прозрачная формула. Поняв ее, вы сможете говорить с любым подрядчиком на одном языке.
Стоимость за 1 единицу = Часовая ставка разметчика / Скорость разметки (KPI)
Часовая ставка: Сколько стоит час работы специалиста.
Скорость разметки (KPI): Сколько единиц (картинок, объектов, секунд аудио) специалист успевает обработать за час.
Пример из реальной жизни: Предположим, часовая ставка разметчика — 300 рублей. На тестовом задании он показал, что может разметить 120 кадров видео за час.
Считаем стоимость: 300 руб. / 120 кадров = 2.5 рубля за один кадр.
Эта формула — ваш главный инструмент для проверки адекватности любой оценки. Профессиональный подрядчик всегда сможет показать вам, из каких ставок и KPI он исходил при расчете.

Виды разметки данных и их стоимость
Теперь давайте применим эту формулу к разным типам задач и посмотрим, где скрываются нюансы, влияющие на итоговую цену.
1. Object Detection (Bounding Box и Polygon Segmentation)
Это самый распространенный тип разметки, где нужно выделить объекты прямоугольниками или обвести их точным контуром.
На что обратить внимание:
- Оплата за объекты, а не за изображения. Если на одной вашей фотографии может быть 1 объект, а на другой — 50, честный подрядчик предложит цену за каждый размеченный объект, а не за все изображение. Это защищает и вас от переплаты за пустые кадры, и подрядчика от неоплачиваемой работы.
- Экспертиза разметчиков. Если вам нужно отличить дефект сварки от царапины, вам нужен специалист, а не обычный разметчик. Его часовая ставка будет выше, и это нормально.
2. Audio & Text Classification
Здесь задача — прослушать аудио или прочитать текст и присвоить ему определенный класс (например, «позитивный отзыв», «негативный», «спам»).
На что обратить внимание:
- Субъективность восприятия. Это главный риск. То, что для одного человека «агрессивный диалог», для другого — «эмоциональный спор». Ключ к успеху — синхронизация. Убедитесь, что подрядчик проводит калибровочные сессии между вами и командой разметки, чтобы все одинаково понимали критерии.
- Ценообразование для аудио. Оплата обычно привязывается к минутам размеченного аудио. Но важно уточнить, сколько реального времени разметчика уходит на 1 минуту записи. Если аудио шумное, с перебиваниями, трудозатраты могут быть 3-4 минуты на 1 минуту аудио.

3. Keypoints, Landmarks & LIDAR
Это сложные типы разметки, требующие расстановки ключевых точек на объектах (например, на лице человека) или работы с 3D-данными (облаками точек).
На что обратить внимание:
- Пространственное мышление. Некоторые задачи требуют от разметчика «додумать» и поставить точку там, где объект не виден. Это требует особого навыка, и не каждый разметчик подойдет. Это напрямую влияет на скорость (KPI) и стоимость.Убедитесь, что подрядчик проводит отбор исполнителей и не бросает их 1 на 1 с ТЗ в «вакууме».
- Нагрузка на интерфейс. Как и в случае с полигонами, большое количество точек может тормозить софт. Уточните, проводились ли тесты.
4. HTML Classification
Задача — проверить содержимое веб-страницы и присвоить ей класс.
На что обратить внимание:
Никаких компромиссов по качеству. Самый большой соблазн для недобросовестного подрядчика — размечать, не переходя по ссылке, если результат «кажется очевидным». Это прямой путь к браку. Требуйте 100% проверки каждой строки. Клиент платит за полную проверку, и он должен ее получить.

Главный совет: требуйте прозрачности
Убедитесь, что подрядчик не оставляет своих разметчиков в «информационном вакууме». Спросите, как выстроено обучение, контроль качества и коммуникация с командой. Успех проекта напрямую зависит от того, насколько хорошо исполнители поняли вашу задачу.
Хотите еще больше практических советов и инсайдов? Ждем вас в нашем Телеграм-канале!
Нужна качественная разметка данных с прозрачной оценкой?
Доверьте ваш проект команде, которая говорит с вами на одном языке и может обосновать каждую цифру в коммерческом предложении.
[Получите бесплатный расчет стоимости вашего проекта в NeuroCore]
