Извините, регистрация закрыта. Возможно, на событие уже зарегистрировалось слишком много человек, либо истек срок регистрации. Подробности Вы можете узнать у организаторов события.
ВНИМАНИЕ! РЕГИСТРАЦИЯ ЗАКРЫТА. Те, кто не успели зарегистрироваться, смогут посмотреть доклады онлайн. В день митапа трансляция станет доступна по этой ссылке: https://bit.ly/2Ro5Bih
Программа
«Опыт запуска Discover для 90 млн пользователей: пять рекомендаций ML-разработчикам», Андрей Законов, vk.com
О докладе
- Важна не только модель: правильно формулируем задачи и выбираем метрики.
- Разные способы оптимизировать свои решения под нагрузки.
- Правильно оцениваем эксперименты: изучаем графики и работаем с обратной связью.
«Как научить поисковики читать мемы», Григорий Кузовников, FunCorp
О докладе
iFunny — приложение со смешными картинками и видео. Единственный текстовый контент, который есть, — это пользовательские комментарии, но для того, чтобы привлечь трафик с поисковиков, его недостаточно, поэтому было решено извлечь текст с картинок и разместить его на страницах. Специально для этого был создан сервис, который:
находит на картинке область, содержащую «основную шутку»
извлекает текст из этой области
проверяет качество распознанного текста
Сервис написан на Python с использованием tensorflow. Опыта в разработке ML-сервисов ни у кого в команде не было, поэтому мы прошли все этапы:
1. Постановка задания.
2. Первые эксперименты, когда мы пытались сделать что-то, что хоть как-то работает, экспериментируя с архитектурой нейронных сетей.
3. Составление обучающей выборки.
4. Обучение и подбор коэффициентов модели.
5. Создание сервиса, использующего нашу обученную модель. Оборачивание его в docker-контейнер.
6. Деплой и привязка сервиса к нашему php-монолиту. Холостой запуск.
7. Первые результаты работы и замечания от прокатов.
8. Использование результатов распознавания в бою.
9. Анализ результатов.
10. Сейчас мы здесь. Нам всё ещё только предстоит переделать и переобучить модели для повышения количества корректно распознанных мемов.
«Production в ML», Марк Андреев, Conundrum.ai
О докладе
В докладе пойдёт речь:
- о видах предсказаний: realtime, offline, realtime + offline
- о том, как от прототипа в Jupyter Notebook дойти до контейнера
- о масштабировании решения и о контроле качества.
«Машинное обучение в Yandex.Taxi», Роман Халкечев, Yandex.Taxi
О докладе
В докладе пойдёт речь про устройство Яндекс.Такси. Будет подробный рассказ про задачи, которые мы решаем с помощью анализа данных и технологий машинного обучения, а также про наш конвейер разработки, тестирования и запуска в продакшн моделей машинного обучения. Пройдёмся по всем этапам: от экспериментов в Jupyter Notebook до полноценного ML-продакшна.
«Избавляемся от проклятия Sklearn: пишем XGBoost с нуля», Артём Хапкин, Mail.ru Group
О докладе
Рассказ про бустинг. Что нужно знать, чтобы самому его написать. Какие есть подводные камни, как можно улучшать его работу.
В настоящее время сложно представить место, где не используются ансамблевые алгоритмы бустинга над решающими деревьями. Это и поисковые движки, алгоритмы ранжирования рекомендаций, соревнования на Kaggle и ещё много где.
Существуют много готовых реализаций алгоритма: Catboost, Lightgbm, Xgboost и прочее. Однако, бывают случаи, когда пользоваться готовыми решениями из коробки не очень хорошо — теряется понимание работы алгоритма, а для определённых задач такие реализации не очень подходят и пр.
В этом докладе мы разберём принципы работы алгоритма, и, двигаясь от простого к сложному, реализуем свой собственный алгоритм Xgboosting’а, который потом можно будет подстраивать для любых задач машинного обучения — классификации, регрессии, ранжирования и т.д.
Больше информации в Telegram
Количество мест ограничено.
Для тех, кто не сможет приехать или не успеет записаться, на нашем канале будет вестись трансляция.