Как выучить машинное обучение?

Руководитель Центра когнитивных технологий Илья Калагин рассказал Tproger.ru о лучших курсах и учебниках для освоения машинного обучения:

Доля проектов с применением искусственного интеллекта и машинного обучения ежегодно растет, и скорость этого роста только увеличится. Рынок испытывает острую нехватку специалистов, что отражается на порядке зарплат в отрасли и ситуации в целом. Молодые люди, привлеченные высокой востребованностью и уровнем компенсаций, видят рекламные объявления онлайн-курсов с обещанием сделать из них Data Scientist за 2–3 месяца и записываются без сомнений.


В первую очередь стоит опровергнуть распространенное заблуждение, что за 2–3 месяца можно стать Data Scientist. На старте освоения специализации важно осознать, что это долгий путь и он не сводится к умению строить модели и работать с Kaggle. В приоритете – глубокое понимание работы с данными: определение их структуры, визуализация и анализ. То есть основой всему — системное качественное образование в фундаментальных дисциплинах: линейной алгебре, статистике, теории вероятностей, лингвистике и др.


Работа в реальности сильно отличается от опыта решения задач в Kaggle или на хакатонах: редко мы имеем дело с чистыми, качественными и подготовленными данными. Kaggle – это хорошо, но надо отдавать отчет, что применяемые там сложные алгоритмы, ансамбли моделей в реальной практике часто не работают или работают не так. В жизни нам подчас важнее скорость обработки, которую при подобном подходе обеспечить сложно. На одном из хакатонов призовое место досталось команде, которая случайно и незначительно увеличила точность за счет введения поля id, но в жизни это ни на что не влияет и было бы удалено за

ненадобностью.


Пример кода:

from sklearn.ensemble import RandomForestClassifier

classifier = RandomForestClassifier(n_estimators =70, criterion='gini', random_state=101, max_features=4)

classifier.fit(X_train, y_train)


Такой фрагмент кода можно написать, посмотрев небольшое видео или прочитав статью. Но это не значит, что вы стали специалистом и приобрели требуемые навыки. Стать им можно только благодаря опыту, наставничеству и участию в реальных проектах. После 2 лет обучения с погружением в практику мы получаем хорошего Junior Data Scientist, а не через 2–3 месяца пассивного изучения курсов.


Если на входе у человека есть подобное понимание профессии, то он сможет правильно построить обучение и карьеру. И очевидный совет – уже на этапе освоения специальности ищите возможность практики. Наш центр рад студентам: мы готовы предложить работу над реальными проектами в формате стажировки и предоставить ресурсы для реализации интересных нам идей.


Теперь онлайн-курсы и книги, которые будут полезны:


1. Machine learning. Онлайн-курс Стэнфордского университета на платформе Coursera. Преподаватель – легендарный Эндрю Ын (Andrew Ng), один из самых известных экспертов в сфере искусственного интеллекта. Многие считают этот курс устаревшим. Я согласен, но это основа основ машинного обучения; классический курс, обязательный для изучения и непростой для прохождения. Сам его прошел с удовольствием: требуются терпение и усилия, чтобы дойти до конца, но он формирует необходимую базу для дальнейшего развития. И также рекомендую более свежий курс этого преподавателя — Deep Learning Specialization.

2. Школа анализа данных Яндекса. Из русскоязычных ресурсов могу посоветовать онлайн-курсы ШАД в партнерстве с МФТИ в рамках специализации «Машинное обучение и анализ данных». Это около года системного обучения, но стоит помнить, что полученные знания должны быть связаны с практическим опытом решения задач.

3. Machine Learning A-Z™: Hands-On Python & R In Data Science. Один из популярных и высоко оцененных англоязычных курсов. Состоит из десяти частей, в которых рассматривается обработка данных, регрессия, классификация, кластеризация, обучение с подкреплением, обработка естественного языка и глубокое обучение. Базовый курс, который однозначно стоит вложенных усилий.

4. Прикладное машинное обучение c библиотеками Scikit-Learn и TensorFlow. Книга Орельена Жерона (Aurelien Geron) — отличное введение в теорию и практику прикладного машинного обучения. С ее помощью можно изучить широкий спектр методов – от линейной регрессии до глубокого обучения. В пособии множество качественных примеров решения задач с применением библиотек Scikit-Learn и TensorFlow.

5. Глубокое обучение на Python, Франсуа Шолле. Автор предлагает более 30 примеров программного кода с подробным комментарием и рекомендациями, что делает книгу ориентированной на решение практических задач. В примерах используются фреймворк глубокого обучения Keras, написанный на Python, и библиотека TensorFlow в качестве внутреннего механизма.


Подробнее: Как выучить машинное обучение?

  • Белый Facebook Icon
  • Белый Иконка YouTube

+7 (929) 555-98-80

ул. Кедрова, 15
117036, Россия, г. Москва

 © 2020 ЦЕНТР КОГНИТИВНЫХ ТЕХНОЛОГИЙ.  Разработка и внедрение систем искусственного интеллекта.

цкт лого [Восстановлен].png