• 9 февраля 2019, суббота
  • Москва, 4-й Лесной переулок, д 4, БЦ "White stone"

FunTech ML-meetup

Регистрация на событие закрыта

Извините, регистрация закрыта. Возможно, на событие уже зарегистрировалось слишком много человек, либо истек срок регистрации. Подробности Вы можете узнать у организаторов события.

Другие события организатора

ООО "ФАНКОРП МЕДИА"
2174 дня назад
9 февраля 2019 c 12:00 до 17:00
Москва
4-й Лесной переулок, д 4, БЦ "White stone"

ВНИМАНИЕ! РЕГИСТРАЦИЯ ЗАКРЫТА. Те, кто не успели зарегистрироваться, смогут посмотреть доклады онлайн. В день митапа трансляция станет доступна по этой ссылке: https://bit.ly/2Ro5Bih

Программа

 

«Опыт запуска Discover для 90 млн пользователей: пять рекомендаций ML-разработчикам», Андрей Законов, vk.com

 

О докладе

- Важна не только модель: правильно формулируем задачи и выбираем метрики.

- Разные способы оптимизировать свои решения под нагрузки.

- Правильно оцениваем эксперименты: изучаем графики и работаем с обратной связью.

 

«Как научить поисковики читать мемы», Григорий Кузовников, FunCorp

 

О докладе

iFunny — приложение со смешными картинками и видео. Единственный текстовый контент, который есть, — это пользовательские комментарии, но для того, чтобы привлечь трафик с поисковиков, его недостаточно, поэтому было решено извлечь текст с картинок и разместить его на страницах. Специально для этого был создан сервис, который:

  • находит на картинке область, содержащую «основную шутку»

  • извлекает текст из этой области

  • проверяет качество распознанного текста

Сервис написан на Python с использованием tensorflow. Опыта в разработке ML-сервисов ни у кого в команде не было, поэтому мы прошли все этапы:

1. Постановка задания.

2. Первые эксперименты, когда мы пытались сделать что-то, что хоть как-то работает, экспериментируя с архитектурой нейронных сетей.

3. Составление обучающей выборки.

4. Обучение и подбор коэффициентов модели.

5. Создание сервиса, использующего нашу обученную модель. Оборачивание его в docker-контейнер.

6. Деплой и привязка сервиса к нашему php-монолиту. Холостой запуск.

7. Первые результаты работы и замечания от прокатов.

8. Использование результатов распознавания в бою.

9. Анализ результатов.

10. Сейчас мы здесь. Нам всё ещё только предстоит переделать и переобучить модели для повышения количества корректно распознанных мемов.

 

 

«Production в ML», Марк Андреев, Conundrum.ai

 

О докладе

В докладе пойдёт речь:

- о видах предсказаний: realtime, offline, realtime + offline

- о том, как от прототипа в Jupyter Notebook дойти до контейнера

- о масштабировании решения и о контроле качества.

 

 

«Машинное обучение в Yandex.Taxi», Роман Халкечев, Yandex.Taxi

 

О докладе

В докладе пойдёт речь про устройство Яндекс.Такси. Будет подробный рассказ про задачи, которые мы решаем с помощью анализа данных и технологий машинного обучения, а также про наш конвейер разработки, тестирования и запуска в продакшн моделей машинного обучения. Пройдёмся по всем этапам: от экспериментов в Jupyter Notebook до полноценного ML-продакшна.

 

 

«Избавляемся от проклятия Sklearn: пишем XGBoost с нуля», Артём Хапкин, Mail.ru Group

 

О докладе

Рассказ про бустинг. Что нужно знать, чтобы самому его написать. Какие есть подводные камни, как можно улучшать его работу.

В настоящее время сложно представить место, где не используются ансамблевые алгоритмы бустинга над решающими деревьями. Это и поисковые движки, алгоритмы ранжирования рекомендаций, соревнования на Kaggle и ещё много где.

Существуют много готовых реализаций алгоритма: Catboost, Lightgbm, Xgboost и прочее. Однако, бывают случаи, когда пользоваться готовыми решениями из коробки не очень хорошо — теряется понимание работы алгоритма, а для определённых задач такие реализации не очень подходят и пр.

В этом докладе мы разберём принципы работы алгоритма, и, двигаясь от простого к сложному, реализуем свой собственный алгоритм Xgboosting’а, который потом можно будет подстраивать для любых задач машинного обучения — классификации, регрессии, ранжирования и т.д.

 

Больше информации в Telegram 

Количество мест ограничено.

Для тех, кто не сможет приехать или не успеет записаться, на нашем канале будет вестись трансляция.


 

Регистрация

Рекомендуемые события

Организуете события? Обратите внимание на TimePad!

Профессиональная билетная система, статистика продаж 24/7, выгрузка списков участников, встроенные инструменты продвижения, личный кабинет для самостоятельного управления и еще много чего интересного.

Узнать больше