TRAINING DATA
База SPAM сообщений
Текстовые датасеты электронных писем разных форматов для обучения нейронной сети задачам определения спама и классификации сообщений
КЕЙС

Кейс База SPAM сообщений

Machine Learning
Возможность системы автоматически интерпретировать данные и прогнозировать результат
Безопасность
обучение алгоритмов распознавать ситуации, способные причинить вред
NLP
Возможность системы понимать, анализировать и интерпретировать человеческие языки
Сбор данных
Сбор подходящих данных для последующей разметки
Описание КЕЙСов
Контент и формат:
Метрики сбора: 
.csv файл с текстом сообщений jpg/png снимков экрана
10 000 сообщений
15 дней
Датасет состоит из широкого спектра спам-сообщений, включая рекламные предложения, мошеннические схемы и попытки фишинга
Язык:
Английский
Смс-спам на английском языке
НАМ ДОВЕРЯЮТ
Контент и формат:
.csv файл с текстом сообщений (title, text, type) jpg/png снимков экрана
Метрики сбора: 
Язык: 
15 000 сообщений 
20 дней
Английский, Испанский, Французский, Немецкий, Польский, Чешский
Email-спам на европейских языках
Датасет состоит из набора электронных писем, разделенных на два основных класса: “спам” и “не спам”. E-mail длиной  от 50 до 7500 символов написаны на разных языках, оформлены в разговорном и официальном стилях речи
Контент и формат:
.csv файл с текстом сообщений jpg/png снимков экрана
Метрики сбора: 
10 000 сообщений 
12 дней
Язык:
Русский
Русские спам-смс
Датасет содержит примеры нежелательных текстовых сообщений, в который включены рекламные рассылки, вирусные ссылки, предложения о микрофинансировании и другие мошеннические схемы
типы услуг
-01-
Обучение LLM распознавать разные форматы спама, генерировать, переписывать и производить любые другие действия по запросу на основе spam текстов
-02-
Защита от спама в чат-приложениях: NLP для улучшения системы фильтрации спама в чатах и предотвращения нежелательных сообщений, рекламы или вредоносных ссылок, а также повышения защиты и безопасности
-04-
Защита от фишинга: Классификация для распознавания фишинговых писем и предотвращения пользователей от взаимодействия с ними
-03-
Предотвращение
текстового спама в комментариях: NLP для выявления и блокировки спама в комментариях и обеспечения безопасности и комфорта при использовании мобильных приложений
-05-
Оптимизация
маркетинговых кампаний: Классификация для автоматической фильтрации нежелательных или мошеннических запросов от пользователей и улучшения качества и точности маркетинговых кампаний
Похожие датасеты
НА ИТОГОВУЮ СТОИМОСТЬ ПРОЕКТА ВЛИЯЮТ:
Объем работ
Сложность разметки
Сроки
Качество разметки
Гарантия качества наших данных 95%. При заказе разметки с качеством выше 95% мы предлагаем enterprise решения