Подкаст ЦМФ о разметке данных для машинного обучения
Тайминг:
0:08 Школа и выбор ВМК МГУ 0:46 "Программировать у меня отбили желание на первых курсах" 0:59 Кафедра ИО 1:13 Полезные курсы 1:48 Научная специализация - оценка опционов 2:13 Стажировки в Тинькофф банк и Prisma 3:13 Как начал изучать машинное обучение 4:07 "Сейчас изучаю активно английский язык" 4:41 Как из финансов и data science оказался в разметке данных 5:43 О разметке данных 7:02 Краудсорсинг 7:56 Какие платформы по разметке данных использует 8:14 Взаимодействие с толокерами 9:22 О TrainingData.ru 10:13 "Сейчас бум ML и как в позапрошлом веке была золотая лихорадка, когда искали золото и в основном зарабатывали те, кто продавал кирки, тут тоже самое: много ML компаний, которые разрабатывают нейронные сети, а мы для них продаём размеченные данные" 11:28 Рабочий процесс по разметке 12:40 Анонимность и конфиденциальность данных 13:57 Dataset с обнажёнными девушками 14:20 Кейс с антиспуфингом 15:11 Медицинские кейсы 15:47 Кейс с лидарами и беспилотными автомобилями 16:27 Разметка данных для онлайн-торговли 18:01 Кейсы по распознаванию аудио 19:21 Почему не занимаются параллельно ML 20:05 Хакатоны и Kaggle 21:32 "Мы выкладываем данные на Kaggle в надежде, что какому-то учёному они пригодятся и он будет нам благодарен" 23:09 О работе с университетами 23:57 Планы развития компании 24:27 "Написание статей и постов в телеграмм-канале - помогает мне структурировать информацию" 25:34 Что читает и рекомендует 26:21 Преподавание: "Промышленное машинное обучение" для НИУ ВШЭ и курс по краудсорсингу с Яндексом для ШАД, МФТИ и Сколково 27:20 Собственная методика проведения занятий 28:26 "Задачи становятся всё более сложные и объёмные" 29:46 Три типа компаний на рынке разметки 31:23 Насколько важны оборотные средства и долгосрочное финансирование 33:23 О росте рынка по разметке данных 34:34 О поиске заказчиков в США 35:20 Цели на 10 лет 36:01 Об учёбе на ЦМФ 36:56 Об ассистировании на ЦМФ - съёмке видео-лекций 38:32 "Когда я закончил ЦМФ, я запустил майнинг эфира на этой видеокарте, что мне принесло много-много денег" 39:10 Советы студентам по построению карьеры 40:03 "Лучше искать окружение, а работа из этого окружения к тебе придёт" 40:55 "В моё время много парней изучили блокчейн и стали много зарабатывать, потому что они быстро разобрались в новой отрасли, которая была актуальна, но где не было специалистов"
Рассказ о моем пути в мире информатики начинается с выбора университета. Когда-то, на первых курсах, программирование казалось мне чем-то сложным и непонятным. Но моя история не остановилась на этом. Я решился выбрать кафедру информатики и обсудить с ней свои предпочтения. На кафедре информатики меня ждало множество интересных курсов и возможность научиться чему-то новому. Однако мое настоящее вдохновение пришло, когда я начал изучать машинное обучение. Сегодня я активно развиваю свой английский язык, чтобы быть в курсе последних тенденций в этой области. Из финансового мира и data science меня занесло в увлекательную область разметки данных. Этот процесс включает в себя работу с краудсорсинговыми платформами и взаимодействие с толокерами. Наша компания TrainingData.ru занимается предоставлением размеченных данных для множества ML-компаний, которые создают нейронные сети. Рабочий процесс по разметке требует внимания к анонимности и конфиденциальности данных, ведь мы работаем с разнообразными кейсами, включая медицинские данные, антиспуфинг и даже информацию о беспилотных автомобилях. Кроме того, мы поддерживаем сообщество, выкладывая данные на Kaggle, в надежде, что они пригодятся ученым и специалистам в машинном обучении. Наша работа также включает в себя сотрудничество с университетами и преподавание курсов по промышленному машинному обучению. Наша собственная методика проведения занятий помогает студентам справляться с всё более сложными задачами. На рынке разметки данных можно выделить три типа компаний, и для нас важно учитывать оборотные средства и долгосрочное финансирование. Тем временем рынок разметки данных продолжает расти, и мы ищем заказчиков даже за пределами России, в США. Мои планы на ближайшие 10 лет включают написание статей, преподавание и развитие собственной компании. Учеба в Центре математической физики МГУ также оставила след в моей карьере. Я даже ассистировал на лекциях и снимал видеолекции. И, конечно же, не могу не поделиться советами для студентов. Лучше всего искать окружение, в котором ты можешь расти и развиваться. Иногда успех приходит к тем, кто быстро осваивает новые области, как блокчейн, когда в них еще нет специалистов.