TRAINING DATA
TRAINING DATA JORNAL  
Авторские статьи

Что такое Толока?

Толока — онлайн-платформа краудсорсинга от компании Яндекс. Проект был основан в 2014 году в целях машинного обучения и совершенствования поисковых алгоритмов. Его смысл: привлечь большую аудиторию для выполнения простых заданий по разметке данных, в основном связанных с анализом и оценкой контента. Задачи оплачиваются сразу после приема заказчиком, минимальная сумма для вывода денег — 1 доллар. Выводить гражданам РФ можно на кошелек QIWI или в ЮMoney (только для официально зарегистрированных в качестве самозанятых).
В июле 2023 года Яндекс заявил о том, что Толока сосредоточится на зарубежных клиентах. А пользователи из России смогут продолжить работу на новом сервисе — Яндекс.Задания. Платформа уже запущена, подключиться к ней можно только после официальной регистрации в качестве самозанятого.

Кто может заказывать задания на Толоке?

Любая компания, от небольших стартапов до крупных международных организаций. Например, TrainingData тоже использует сайт для сбора данных. За датасет из 871 фотографии счетчиков воды мы заплатили около 25 долларов. В эту сумму вошло и второе задание для толокеров — проверка, насколько присланные фотографии соответствуют ТЗ. Все, что от нас требовалось: создать два задания, написать подробные инструкции и подождать, пока толокеры их выполнят.
Одно из главных преимуществ Толоки для работодателя — быстрый и недорогой результат. На платформе постоянно онлайн тысячи людей из разных стран, готовые зарабатывать в любое время суток. Выполнять задачи можно на сайте и в мобильном приложении.
Другие плюсы сервиса:
  • Возможность проверки работ независимыми исполнителями.
  • Быстрое масштабирование проекта
  • Экономия времени и ресурсов.

Какие задачи можно решать в Яндекс.Толоке?

  1. Разметка изображений для машинного обучения — например, для распознавания объектов, классификации.
  2. Разметка аудио — например, выделение разговора из фонового шума, классификация звуковых эффектов.
  3. Поиск и категоризация информации — пользователи помогают сортировать и классифицировать контент в соцсетях, интернет-магазинах.
  4. Анализ текстов — расшифровка с изображений, анализ тональности, модерация.
  5. Пешеходные задания — сбор информации о компаниях офлайн, услуги тайного покупателя и т. д.

Как Толока помогает в машинном обучении?

При обучении модели важно предоставить ей большой объем данных, чтобы ИИ получил полное представление о возможных вариациях при решении поставленной задачи. На Толоке можно быстро собирать датасеты под проект практически любого масштаба. Информация будет уникальной: толокеры сделают фотографии и снимут видео по вашему ТЗ.
Методики Сбор данных Разметка данных