Например, если нужно обучить алгоритм отличать кошек от собак, ваш датасет должен состоять из изображений животных, где для каждой фотографии сказано, кто на ней присутствует — это задача по классификации.
Если нужно научиться находить пешеходов на изображении, то это уже задача определения объекта на изображении (object detection), и в этом случае нужен датасет из изображений, на которых люди выделены прямоугольниками. Также можно обучить алгоритм находить людей по описанию.Принцип работы очень прост: человек загружает свою фотографию в бот, а через несколько минут получает развернутый отзыв о себе.
С точки зрения пользователя все просто: человек начинает диалог с чат-ботом, принимает условия использования сервиса (так как изображения могут являться персональными данными, а владельцы бота передают изображения в «Толоку», они должны иметь соответствующее право). Затем загружает свое изображение, а через 5 минут получает развернутый отзыв о себе. Первое изображение чат-бот обрабатывает бесплатно, каждое последующее изображение стоит 10 рублей.Оптимальным решением стал краудсорсинг. Так, в «Толоке» постоянно находятся более 10 тысяч исполнителей, которые готовы круглосуточно выполнять задания и сделают это в разы быстрее, чем единственный исполнитель.
К примеру, у компании есть задача обработать несколько сотен тысяч изображений. Фрилансеры потратят на выполнение такого задания несколько месяцев, а толокеры — несколько часов. Безусловно, придется потратить время на создание задания, критериев контроля качества и ханипотов (заданий-ловушек), но это все равно будет быстрее и дешевле, чем наем исполнителей.