Разметка данных — это уже широко известная в технических сферах ниша, она служит основой для обучения нейронных сетей. В последние месяцы все обсуждают LLM и создание данных, но в то же время технологии искусственного интеллекта активно развиваются и в промышленности.
Меня зовут Алексей Корнилов, я менеджер проектов по сбору и разметке данных в Training Data, и я хочу рассказать о том, как сбор и разметка данных используется ML разработчиками в горнодобывающей компании. Около года назад я завершил проект по подготовке датасетов с разметкой пузырьков во время флотации. Звучит сложно, но обо всем по порядку.
Конечной целью работы было обучить нейронную сеть контролировать и анализировать один из этапов сплава руды на заводе. То есть это была задача по автоматизации и механизации ручного труда в потенциально опасных для человека условиях.
О том, как именно отдел инноваций проводил обучение нейронных сетей, можно прочитать в
статье Алексея Клокова. Я же хочу рассказать об этапах и специфике такой разметки данных, организации работы команды разметчиков/AI-тренеров и поделиться выводами в работе с промышленными данными. Статья будет интересна проджект менеджерам, дата-саентологам, ML-инженерам и всем, кто работает в области разметки данных для задач машинного обучения.