В рамках доклада Роман рассказывает, чем отличается хороший датасет от плохого, какие необходимые свойства должен иметь хороший датасет и как их достичь. Говорит о способах контроля качества и о том как выстроить пайплайн разметки внутри компании. Рассматривает основные ошибки при организации процесса разметки и как их можно избежать.
• Отличия между Data-Centric и Model-Centric подходами • Итеративный подход к разметке: плюсы и минусы • Построение эффективного процесса обучения разметчиков • Методы контроля качества • Основные ошибки в менеджменте разметчиков