Детская речь

Аудио и транскрибация детской речи. Русский, английский, испанский и другие языки

Кейс

Кейс Детская речь

NLP

Технология машинного обучения для интерпретации компьютером речи человека

Machine Learning

Возможность системы автоматически интерпретировать данные и прогнозировать результат

ASR

Технология преобразования речи в текстовый формат

Сбор данных

Сбор подходящих данных для последующей разметки

1 000

аудиозаписей

8 нелель

срок выполнения

Описание КЕЙСa

Датасет состоит из 5 000 аудиоматериалов, собранных с помощью краудсорсинговых платформ и внутреннего штата AI - тренеров. Тема аудио - детские вопросы, или “Почемучка”

Каждый ребенок записал:
1 видео (для проверки)
6 зачитанных готовых предложений
3 импровизации

Формат данных:
mp3 и xml - файл с расшифровкой

Смотреть на Kaggle

Скачать пример

НАМ ДОВЕРЯЮТ

Область применения датасета

для разработки системы автоматического распознавания и транскрибирования детских речевых записей

ASR

для систем автоматического определения возраста или возрастной категории пользователей

NLP и классификация данных

для внутренней базы LLM сервисов, которые работают с детской аудиторией

Cбор данных

Разметка аудиоматериалов

Training Data оказывает полный цикл услуг по работе с аудио данными на 40+ языках, наречиях, акцентах при разных фоновых условиях для качественного обучениях Ваших нейронных сетей

Датасеты и услуги по обучению LLM для корпоративных GPT моделей

В Training Data мы предоставляем полный цикл работы с данными для обучения, оценки и тестирования LLM моделей по 12 индустриям

Похожие датасеты

Selfie and video dataset

Фото и видео людей, снятые на телефон и на веб-камеру при разном освещении. На видео люди произносят цифры на русском языке в произвольном порядке

Speech to text распознавание речи

Датасет решает задачи распознавания и синтеза топонимов на русском языке

Трансрибация звонков

Более 60 различных тем и 100 000 часов аудио

Сбор впечатлений о людях

Датасет для обучения нейронной сети задачам сопоставления текстового описания первого впечатления о человеке с фотографией этого человека

Все Датасеты

НА ИТОГОВУЮ СТОИМОСТЬ ПРОЕКТА ВЛИЯЮТ:

Объем работ

Сложность разметки

Сроки

Качество разметки

Гарантия качества наших данных 95%. При заказе разметки с качеством выше 95% мы предлагаем enterprise решения

Заказать расчет стоимости

ВАМ Понравится

Разметка аудио

Многие приложения с искусственным интеллектом, начиная от чат-ботов и голосовых помощников типа Алисы и заканчивая системами безопасности с возможностью распознавания речи, автомобильными навигаторами, являются продуктами машинного обучения

Распознавание речи с помощью машинного обучения

Автоматическое распознавание речи представляет собой технологию обработки голоса и преобразования аудиоинформации в текстовый формат