TRAINING DATA
Сбор впечатлений о людях
Датасет для обучения нейронной сети задачам сопоставления текстового описания первого впечатления о человеке с фотографией этого человека
КЕЙС

Кейс Сбор впечатлений о людях

Сбор данных
Поиск данных для создания обучающих датасетов.
NLP
Возможность системы понимать, анализировать и интерпретировать человеческие языки
LLM
Датасет для обучения больших языковых моделей
Machine Learning
Возможность системы автоматически интерпретировать данные и прогнозировать результат
100 000
текстовых описаний
5 недель
срок выполнения
Описание КЕЙСА
Датасет собран на платформе “Толока” Романом Куцевым в рамках личного проекта 2019 года - “Впечатлятор”
Пользователь Вконтакте отправлял любую фотографию в чат и в течение 5 минут бот описывал свое первое впечатление о человеке не фото
В датасете представлены 100 000 текстовых описаний фотографий людей. Каждый фрагмент текста проходил проверку на грамматические ошибки, оскорбления, ненормативную лексику и другие нарушения этики
Область применения датасета
для мониторинга мнений о людях в социальных сетях
для определения потенциальных клиентов или покупателей
NLP анализ мнений в социальных сетях:
для улучшения работы рекомендательных систем, например, системы рекомендаций фильмов или товаров
KYC идентификация потенциальных клиентов:
Рекомендательные системы:
Training Data оказывает полный цикл работ по сбору и разметке текстовых материалов для разработки и обучения AI речевых моделей и систем оцифровки
Начальный этап любого ML проекта. Поиск и подготовка обучающих данных для нейронных сетей
Похожие датасеты
НА ИТОГОВУЮ СТОИМОСТЬ ПРОЕКТА ВЛИЯЮТ:
Объем работ
Сложность разметки
Сроки
Качество разметки
Гарантия качества наших данных 95%. При заказе разметки с качеством выше 95% мы предлагаем enterprise решения
Оставьте заявку, чтобы приобрести лицензию, заказать датасет или получить больше информации