Как обучить и дообучить модель LightGBM, создать автоэнкодер с функцией шумоподавления, как эффективно смешивать модели
Проанализируйте наилучшие решения с конкурса Kaggle M5 и узнайте, как повысить точность решения задач на временные ряды.
Распределите изображения кассавы (клубневая культура) на четыре категории в зависимости от заболевания растения, а в пятую категорию выделите здоровые листья
Воспользуйтесь библиотекой трансформеров Hugging Face и создайте прогностическую субъективную вопросно-ответную модель
Конкурсы Kaggle – это поле для состязаний, где меряются силами миллионы специалистов по науке о данных (data science), которые сами себя именуют «кэглерами». Участие в таких конкурсах – верный способ профессионально вырасти в области анализа данных, влиться в замечательное сообщество единомышленников и приобрести бесценный опыт для развития карьеры. Авторы книги – грандмастера Kaggle. Они познакомят вас со стратегиями моделирования, которые более нигде не рассмотрены, и подскажут, как удобнее всего обрабатывать изображения, тексты, таблицы, как правильно реализовать обучение с подкреплением. Вы освоите качественные схемы валидации и станете уверенно ориентироваться в самых разных оценочных метриках.
Лука и Конрад рассказали о Kaggle максимально доступно. Оба они – первоклассные профессионалы, пользующиеся большим авторитетом и уважением в сообществе Kaggle. Проштудировав эту книгу, можете смело регистрироваться на Kaggle и рассчитывать на высокие результаты.
Энтони Голдблум, основатель и генеральный директор Kaggle
В книге рассказано:
- Как устроена соревновательная платформа Kaggle
- Как выжать максимум из ноутбуков, датасетов и форумов Kaggle
- Как правильно собирать портфолио проектов и идеи для развития карьеры
- Как проектировать k-мерные и вероятностные схемы валидации
- Как освоить наиболее распространённые и экзотические оценочные метрики
- Как устроена бинарная и многоклассовая классификация объектов, а также их обнаружение
- Как эффективно обращаться с временными рядами и обработкой естественного языка (NLP)
- Как преуспеть в задачах на имитационное моделирование и оптимизацию
Конрад Банахевич (Konrad Banachewicz) — обладатель степени PhD по статистике, полученной в Свободном университете Амстердама (Vrije Universiteit Amsterdam). В период академической работы в центре его научных интересов было моделирование редчайших явлений в области кредитных рисков. Кроме исследовательской деятельности Конрад работал тьютором и научным руководителем студентовмагистрантов. Он начал карьеру с классической статистики, а затем перешел к извлечению данных (data mining) и машинному обучению (еще до того, как "датасайнс" или "большие данные") стали мейнстримом.
Лука Массарон (Luca Massaron) — исследователь данных, обладающий более чем десятилетним опытом в преобразовании данных в более интеллектуальные единицы. Так решаются прикладные задачи и нарабатывается ценность для бизнеса и заказчиков. Он автор бестселлеров по искусственному интеллекту, машинному обучению и алгоритмам. Также Лука — гроссмейстер Kaggle, достигавший позиции 7 в мировом соревновательном рейтинге по data science, обладатель титула Google Developer Expert (GDE) по машинному обучению.