Подборка полезных материалов по машинному обучению (не для малышей)


Оглавление (нажмите, чтобы открыть):

8 онлайн-курсов по машинному обучению

Anna Lukachuk

Поисковые системы Google и «Яндекс», подбор фильмов под вкусы пользователя, определение жанра композиции по звуковым частотам и даже распознавание в письме спама — все это возможно благодаря анализу больших данных. Обрабатывающие их алгоритмы должны быть или очень сложными, или самообучающимися. Как люди обучают системы и с чего начать свой путь в этой области, мы уже рассказывали. Для тех, кто хорошо знает высшую математику и умеет программировать (хотя бы на Python), — эти 8 онлайн-курсов.

Специализация: машинное обучение и анализ данных

Где и когда: онлайн в любое время (продолжительность — 3–6 месяцев)

Стоимость: 5385 рублей в месяц

Курс начинается с азов — фундаментальной математики и программирования на Python. Затем преподаватели расскажут, как использовать алгоритмы для конкретных бизнес-задач, например прогнозов спроса на товар или расчетов вероятности клика по рекламе. В конце обучения студенты создадут собственный проект по анализу данных для социальных сетей, электронной коммерции и др. Для выпускников доступна программа трудоустройства.

Практический Machine Learning

Организатор: Skill Factory

Где и когда: онлайн с 9 октября (продолжительность — 6 недель)

Стоимость: 54 000 рублей

От освоения Python и алгоритмов машинного обучения до мониторинга результатов и командной работы с жесткими дедлайнами — курс подойдет новичкам, которые хотят применять машинное обучение в бизнесе или начать карьеру data scientist. Те, кто никогда не программировал, могут подготовиться к обучению заранее — организаторы вышлют все необходимые материалы.

Машинное обучение для руководителей

Организатор: Фонд развития онлайн-образования

Где и когда: онлайн в любое время (продолжительность — 4 недели)

Стоимость: 25 000 рублей

Основы машинного обучения для руководителей, которые хотят внедрить в работу умные алгоритмы и технологии искусственного интеллекта. Как выбирать подрядчиков, контролировать ход цифровых проектов и определять эффективность машинного обучения для своего проекта — все для осознанных бизнес-решений.

Введение в машинное обучение

Организатор: НИУ ВШЭ, Школа анализа данных «Яндекса»

Где и когда: онлайн в любое время (продолжительность — 7 недель)

Стоимость: 1976 рублей

С какими задачами работает машинное обучение, как выбирать самые эффективные методы и где пригодятся нейронные сети — студенты освоят современный анализ данных на реальных примерах. Для прохождения курса обязательно знание функций, производных, векторов и матриц, а также умение программировать на Python.

Машинное обучение

Организатор: Stanford University

Где и когда: онлайн в любое время (продолжительность — 7 недель)

Стоимость: 4021 рубль

Слушатели познакомятся с основами машинного обучения, глубинного анализа данных и статистического распознавания образов. Мы рассказывали про машинное обучение «с учителем» и «без учителя» — в программе покажут, как это работает на реальных кейсах из Кремниевой долины. Новые навыки пригодятся в работе с интеллектуальными роботами, компьютерным зрением и медицинской информатикой.

Машинное обучение и основы ИИ

Организатор: Keith McCormick

Где и когда: онлайн в любое время (продолжительность — 2 часа лекций)

Работа с большими массивами данных — это всегда необходимость классифицировать, сокращать объем или восполнять недостаток. Курс посвящен 11 полезным алгоритмам для машинного обучения — от дискриминантного анализа и логистической регрессии до искусственных нейронных сетей.

Науки о данных: машинное обучение

Организатор: Harvard University

Где и когда: онлайн в любое время (продолжительность — 4 недели)

Стоимость: бесплатно (с сертификатом — $49)

Популярные алгоритмы машинного обучения, метод главных компонент и прогнозирование данных — курс подойдет тем, кто уже умеет работать с большими данными. Финальный проект — создание системы рекомендаций фильмов на основе предыдущих предпочтений. Если знаний пока не хватает, Гарвард предлагает базовое онлайн-обучение по работе с анализом данных.

Машинное обучение

Где и когда: онлайн в любое время (продолжительность — 3 месяца)

Бесплатный курс от старшего научного сотрудника Google Винсента Ванхоука о нейросетях: как строится их архитектура, зачем нужны сверточная и рекуррентная сети и в чем секрет обучения модели с долгой краткосрочной памятью. Продолжить обучение можно в программе Deep Learning.

Подборка полезных материалов по машинному обучению (не для малышей)

Трудолюбивые и заботливые родители пользуются лучшими предложениями для своих детей, и поступают совершенно правильно. К сожалению, далеко не всегда лучшие решения — самые известные, детские сайты не являются исключением. Специалисты IQша помогут сделать правильный выбор среди наиболее достойных.

МААМ — сайт для практикующих педагогов, построен по типу блога. Матераилы для публикации присылают таланливейшие специалисты! Конспекты занятий и примеры оформления группы к праздникам, детские поделки и примеры игр пригодятся любому родителю, который занимается с ребенком дома и не устает придумывать новые тематические задания.
Раздел «Дошкольное образование» Учительского портала также представляет материалы специалистов: презентации, программы развития, планы и конспекты занятий. Неоспоримое преимущество этого контента — методическая продуманность, гарантия максимальной адаптации обучающего материала к психологии восприятия и обучения детей. Конечно же, вашему ребенку может что-то оказаться не интересным или не таким увлекательным, как вы бы хотели. Но на этом сайте есть из чего выбрать!
Развивающие игры для вашего голопуза — так называется сайт с небольшим количеством ярких, понятных малышам и содержательных флеш-игр. Игры представлены в разделах «Алфавит», «Цифры», «Логические», «Внимание и память», «Пазлы». Самые очевидные плюсы сайта — игры бесплатны, а на сайте нет рекламы! Минус в явно недостаточном количестве этих игр. Впрочем, если их дозировать, как и любую деятельность ребенка за компьютером, их хватит на много увлекательных вечеров!
«Играемся» — еще один сайт с обучающими бесплатными играми для детей. Игры разбиты на категории: на внимание и память, на логику и мышление, загадки и ребусы, пазлы, для малышей и другие. Реклама на сайте есть, но при правильном обращении со страницей ребенок может ее не заметить. Игры созданы на технологии flash и не будут работать на планшетах ipad.
Портал «Чудо-юдо» — настоящий клад развивающих материалов на любой вкус. Кроссворды и ребусы, лабиринты и прописи, скороговорки и аудиосказки, поделки и пазлы для малышей — каждый родитель найдет, чем заняться ребенку любого возраста! Сайт изобилует материалами для распечатывания и описаниями различных оффлайн-активностей. Даже если вы не будете пользоваться никаким другим сайтом для своего ребенка, вы обеспечите деятельность для домашних занятий на несколько лет вперед, потому что задания сайта растут вместе с ребенком.
Сайт «Развитие ребенка» — старожил в интернет-пространстве для детей и родителей. Команда профессиональных педагогов и психологов не устает радовать нас обзорами развивающих игрушек и книг, рекомендациями дидактических пособий, а также описаниями упражнений, которые доступны для выполнения не только в домашних условиях, но и за пределами дома. На сайте много развивающих карточек и раскрасок для распечатывания.
На этих электронных презентациях выросли детки, которые сейчас уже ходят в среднюю школу. Презентации высочайшего методического качества представлены во всем многообразии тем, которое только можно себе представить: еда, улица, история, музыкальные инструменты, животные и многое другое. Если ваш ребенок тянется к компьютеру, но еще мал для самостоятельных занятий — открывайте презентацию и начинайте вести короткие, понятные ребенку рассказы о каждом слайде. Вот увидите, ребенок полюбит эти учебные разговоры не меньше чтения книг!
На сайте «По складам» собраны уникальные игры на обучение детей чтению. Соединяя буквы, склады и слоги, дети сами не замечают, как начинают разбираться в принципах составления и чтения слов. Сайт монетизируется за счет рекламы, поэтому родителям необходимо настраивать окно, в котором ребенок выполняет задание, прежде чем усадить малыша за монитор. Но аналогов этим упражнениям в пространстве рунета практически нет. Игры разработаны на flash, поэтому будут недоступны для apple-устройств.
Развитие детей — максимально лаконичное и понятное название для сайта, на котором есть все необходимое неутомимому родителю. Сайт полон конкретных практических рецептов: как научить пересказывать текст, научить вырезать ножницами, писать цифры, организовать веселый день рождения и многое другое. Статьи в большинстве своем живые, написанные от души, а не для поисковых роботов — тем и притягивает внимание сайт.
Придумать со своими детьми и их друзьями развивающие праздники, стенгазеты и различные обучающие активности вам поможет «Почемучка». На этом сайте много конкурсов для родителей и детей, есть своя библиотека и даже музыка и мультфильмы. В разделе «Мамин клуб» все желающие мамы могут поделиться своими поделками и идеями. Есть и свой форум для обсуждения самых животрепещущих тем.

Дорогие родители, делитесь в комментариях ссылками на сайты для детей и родителей, которые вы считаете для себя незаменимыми!

Понравилось? Поделитесь с друзьями:

Подборка полезных материалов по машинному обучению (не для малышей)

В нашем блоге мы уже рассказывали о разработке системы квантовой связи и о том, как из простых студентов готовят продвинутых программистов. Сегодня мы решили вернуться к теме машинного обучения и привести адаптированную (источник) подборку полезных материалов.

Это список предназначен для тех, кто только начинает изучать тему машинного обучения, например, с использованием Python (если вы хотите начать учить Python, вам в помощь эта статья).

Машинное обучение – это лишь одна из математических дисциплин, связанных с понятием «данные». Чтобы разобраться в том, что такое аналитика данных, анализ данных, наука о данных, машинное обучение и большие данные, прочитайте этот материал.

Экспериментальная функция:

Ниже вы видите текст статьи по ссылке. По нему можно быстро понять ссылка достойна прочтения или нет

Просим обратить внимание, что текст по ссылке и здесь может не совпадать.

Индикатор кулачкового аналогового компьютера / Wiki В нашем блоге мы уже рассказывали о разработке системы квантовой связи и о том, как из простых студентов готовят продвинутых программистов. Сегодня мы решили вернуться к теме машинного обучения и привести адаптированную (источник) подборку полезных материалов. Это список предназначен для тех, кто только начинает изучать тему машинного обучения, например, с использованием Python (если вы хотите начать учить Python, вам в помощь эта статья).

Машинное обучение – это лишь одна из математических дисциплин, связанных с понятием «данные». Чтобы разобраться в том, что такое аналитика данных, анализ данных, наука о данных, машинное обучение и большие данные, прочитайте этот материал.

Вот инструменты, которые вам понадобятся:

Вы можете установить Python 3 и все необходимые пакеты в несколько кликов с помощью сборки

. Anaconda – это достаточно популярный дистрибутив среди людей, занимающихся машинным обучением.

Не страшно, если у вас установлен Python 2.7. Переходить на Python 3 нет необходимости. Вместо Anaconda вы можете воспользоваться pip или virtualenv. Не можете определиться? Прочитайте

с IPython Notebook (это займет 5-10 минут). Еще можете посмотреть это

. Далее рассмотрите небольшой

(это займет 10 минут) классификации цифр с использованием библиотеки

Наглядное введение в теорию машинного обучения

Давайте побольше узнаем о машинном обучении: об идеях и особенностях. Прочитайте

(Stephanie Yee) и

(Tony Chu) «Наглядное введение в машинное обучение. Часть 1».

профессора Педро Домингоса (Pedro Domingos). Во время чтения не торопитесь, делайте заметки. В статье можно выделить два основных момента:

Одних только данных недостаточно.

Домингос писал: «…нет ничего удивительного в том, что для обучения нужны знания. Машинное обучение не может получить что-то из ничего, но может получить большее из меньшего. Обучение похоже на сельское хозяйство, где большую часть работы делает природа. Фермеры дают семенам питательные вещества, чтобы вырастить урожай. Так и здесь: чтобы создать программу, нужно совместить знания и данные».

Большое количество данных лучше детально продуманного алгоритма.

Не пытайтесь изобретать велосипед и усложнять решения:

кратчайший путь, ведущий к цели. Домингос говорит: «Как правило, «глупый» алгоритм с большим количеством данных превосходит «умный» алгоритм с небольшим количеством данных. В машинном обучении главную роль всегда играют данные».

Итак, знания и данные имеют решающее значение. Это

, что усложнять алгоритмы нужно только тогда, когда у вас действительно нет выбора.

Схема составлена на основе слайда из

Алекса Пинто (Alex Pinto) «Математика на страже безопасности: руководство по мониторингу с применением машинного обучения».

Обучайтесь на примерах

Выберете и рассмотрите один или два примера из представленных ниже.

  • Распознавание лиц на фотографиях из базы данных сайта Labeled Faces in the Wild.
  • Машинное обучение на основе данных о катастрофе Титаника. Здесь демонстрируются методы преобразования данных и их анализа, а также техники визуализации. Есть примеры методов машинного обучения с учителем.
  • Прогнозирование итогов выборов: использование модели Нейта Сильвера (Nate Silver) для составления прогноза итогов выборов президента США в 2012 году, опубликованных The New York Times.

Вот еще руководства и обзоры:

Другие источники, в которых можно найти блокноты IPython:

  • Галерея интересных блокнотов IPython: статистика, машинное обучение и наука о данных.
  • Большая галерея Фабиана Педрегозы (Fabian Pedregosa).

Курсы по машинному обучению

Будет полезно, если вы начнете работать над каким-нибудь небольшим самостоятельным проектом – так у вас будет возможность применить полученные знания на практике. Можете воспользоваться одним из

Еще часто рекомендуют

«The Elements of Statistical Learning», но она, как правило, выступает в роли справочника. Книга бесплатная, поэтому скачайте ее или добавьте в закладки браузера.

Еще есть вот эти онлайн-курсы:

  • Курс «Машинное обучение» профессора Педро Домингоса из Вашингтонского университета.
  • Практикум по науке о данных.
  • Наука о данных.
  • Видео «Введение в машинное обучение с scikit-learn» от Кевина Маркхэма (Kevin Markham). После просмотра видеоматериала, вы можете пройти интерактивный курс по науке о данных (есть его более ранние версии: 7, 5, 4, 3).
  • Гарвардский курс CS109 – наука о данных.
  • Продвинутый курс статистических вычислений (курс BIOS8366 университета Вандербильта).

Отзывы о курсах и различные обсуждения:

  • Ознакомьтесь с ответом Джека Голдинга (Jack Golding) на Quora. Там вы найдете ссылку на специализацию «Data Science» на Coursera – если вам не нужен сертификат, то можете пройти все 9 курсов бесплатно.
  • Другое обсуждение на Quora: как стать специалистом по обработке и анализу данных?
  • Большой перечень ресурсов по науке о данных от сайта Data Science Weekly, а также список открытых онлайн-курсов.

Изучаем Pandas

Чтобы работать с Python, вам необходимо познакомиться с пакетом Pandas. Вот список материалов, которые в этом помогут:

  • Основное: знакомство с Pandas,
  • Руководство: несколько вещей в Pandas, которые я бы хотел знать раньше (блокноты IPython),
  • Полезные фрагменты кода Pandas,

Вам также стоит уделить внимание этим ресурсам:

Еще больше материалов и статей

  • Доступная книга Джона Формана (John Foreman) «Data Smart»,
  • Курс по науке о данных с блокнотами IPython,
  • Статья: основные трудности раздела науки о данных (прочитайте статью и комментарий Джозефа Маккарти (Joseph McCarthy)),
  • IPython: ключевые навыки специалистов по работе с данными.

Вопросы, ответы, чаты

На данный момент лучшим местом для поиска ответов на свои вопросы является

о машинном обучении на stackexchange.com. Также есть сабреддит:

по scikit-learn на Gitter! Еще стоит обратить внимание на

на Quora и большой

материалов по науке о данных от сайта Data Science Weekly.

Другие вещи, которые полезно знать

  • Наука о данных: статья Джона Формана (John Foreman), специалиста по обработке и анализу данных в MailChimp.
  • Статья: одиннадцать факторов, ведущих к переобучению, и как их избежать.
  • Достойная статья: «Машинное обучение: накладные расходы, которые влечет за собой технический долг» («Machine Learning: The High-Interest Credit Card of Technical Debt»). Цель данной статьи: определить специфические факторы риска при машинном обучении и создать шаблоны, с помощью которых можно их избежать.
  • Джон Форман: «Опасный мир машинного обучения».
  • Kdnuggets: «Издержки систем машинного обучения».
Мастер Йода рекомендует:  Основные аспекты информационной безопасности

Вам нужна практика. Пользователь с ником Olympus на Hacker News

, что для этого необходимо участвовать в конкурсах и соревнованиях.

– это платформы для исследователей, где можно попробовать свои силы, участвуя в различных состязаниях.

вы найдете примеры кода для конкурса Kaggle. Еще вариант:

Послушайте и почитайте, что победители конкурсов Kaggle говорят о предложенных ими решениях. Например, почитайте

Конкурсы или состязания лишь один из способов попрактиковаться. Вы можете начать проводить исследования:

  1. Начните с вопроса. «Самая важная вещь в науке о данных – это вопрос», – говорит доктор Джефф Лик (Dr. Jeff T. Leek). Начните с вопроса, затем найдите реальные данные и проанализируйте их.
  2. Огласите результаты и обратитесь за экспертной оценкой.
  3. Устраните найденные проблемы. Поделитесь своими открытиями.

Подробнее о научном методе вы можете узнать

Вот еще парочка руководств по машинному обучению:

38 полезных ресурсов для обучения чему-то новому

Сохраните в закладки, и всегда сможете утолить жажду знаний.

Иностранные языки

1. Duolingo

Обучение в Duolingo проходит в игровой форме: нужно правильно угадывать слова, составлять предложения и выполнять задания с таймером. Сервис отслеживает, как вы усваиваете информацию, и с помощью этих данных составляет личную программу. Сайт бесплатен, но за деньги с него можно убрать рекламу.

2. Memrise

Портал, позволяющий изучать десятки языков с помощью интерактивных заданий и сотен курсов на разные темы (искусство, науки, карьера, развлечения и так далее). Среди прочего Memrise использует видеодиалоги, в которых нужно выбирать правильные варианты ответов. При желании можно даже создать обучающий курс самому, чтобы им пользовались другие.

3. Busuu

Busuu выделяется тем, что с помощью нейросетей составляет индивидуальный план обучения для каждого пользователя. Можно не только выполнять уроки, но и получать по ним обратную связь от носителей языка.

4. LinguaLeo

Отечественный сервис для изучения английского. Предоставляет не только интерактивные задания, но и материалы, помогающие запоминать слова и выражения: фильмы, подкасты, статьи. У некоторых из них есть интерактивные субтитры: при наведении курсора на слово можно узнать его перевод.

5. Babbel

Сайт, позволяющий выучить язык с помощью интерактивных диалогов и системы распознавания речи. Babbel симулирует языковую ситуацию, а потом определяет, правильно ли вы говорите. Изученные слова затем можно закрепить с помощью дополнительных уроков, где они помещаются в новый контекст.

6. FluentU

FluentU помещает пользователя в языковую среду, предлагая ему тысячи видео на выбранном языке. У каждого ролика есть субтитры, на которые можно кликать, чтобы узнать перевод. Первые две недели можно заниматься бесплатно, а потом — за 30 долларов в месяц.

7. MosaLingua

Главное назначение MosaLingua — помочь вам выучить слова и фразы. Сайт использует для этого особый метод, созданный на основе научных исследований. Новые единицы языка запоминаются быстро, но надолго. Также в сервис встроена специальная система, которая просчитывает, насколько часто вам нужно повторять выученное и в каком объёме.

8. The Mixxer

Платформа для поиска собеседников, разработанная американским колледжем Дикинсона. Общение с носителем языка — очень эффективный способ прокачать свои навыки. В соцсети зарегистрированы тысячи человек, говорящие на десятках разных языков. Также на сайте есть бесплатные уроки от университетов и консульств.

9. Italki

Italki позволяет найти преподавателя для персональных уроков иностранного языка или самому стать им. На сайте тысячи тьюторов — любого уровня и стоимости. Обучение оплачивается поурочно, и для него нужны лишь микрофон и веб-камера.

10. Speaky

Социальная сеть для поиска носителей языка и общения с ними. Можно как писать в текстовый чат, так и созваниваться по аудио- или видеосвязи. Сайт устроен очень просто: на нём есть только список профилей и мессенджер.

Музыка

11. Learning Music

Интерактивный учебник от компании Ableton, производящей программы, плагины и аппаратуру для создания и воспроизведения музыки. Подойдёт тем, кто хочет научиться создавать музыку на компьютере, но не знает, с чего начать. Сайт объясняет основы построения мелодий и ритмов и структурирования треков.

12. Lightnote

Сайт, позволяющий изучить основы теории музыки. Благодаря ему вы узнаете, как устроен звук, что такое гармония, какие бывают аккорды, как их брать, как выстраивать мажорный и минорный лады.

13. MusicTheory

Масштабный проект, включающий не только десятки уроков по теории музыки и чтению нот, но и упражнения для тренировки слуха и закрепления знаний, а также полезные инструменты вроде калькулятора нот в тональности.

Программирование

Русскоязычные

14. GeekBrains

На этом портале есть практически всё, что может потребоваться начинающему программисту. Онлайн-уроки, курсы, вебинары, форум, тесты для проверки знаний и даже список вакансий. Сайт охватывает такие темы, как веб-разработка, создание мобильных приложений и игр, программирование на Python, Java и других языках.

15. Hexlet

Сайт с курсами для изучения разных языков программирования. Бесплатно вы получаете доступ к 13 из них и сообществу, а за деньги можно получить ещё 50 курсов и поддержку ментора. Hexlet позволяет научиться программировать на Ruby, Python, PHP, JavaScript, Java, Shell (Utils), HTML & CSS и Racket.

16. Яндекс.Практикум

Онлайн-школа от «Яндекса», в которой можно освоить профессии фронтенд- и бэкенд-разработчика, специалиста по Data Science, веб-разработчика и аналитика данных. Ученики получают прикладные навыки и поддержку наставников, а также практикуются, создавая программы и сайты. Первые 20 часов можно заниматься бесплатно, а полный курс стоит от 60 до 90 тысяч рублей.


Англоязычные

17. The Odin Project

Сайт для обучения веб-программированию. Здесь вы найдёте несколько курсов — от начального уровня до продвинутого — и мощное комьюнити, готовое помогать новичкам. Можно освоить Ruby on Rails, Node.js, HTML и CSS, Javascript, базы данных и узнать, как правильно искать работу в сфере IT.

18. SoloLearn

На этом портале есть сотни уроков для изучения разных языков (Ruby, Python, C++, Java, Javascript, PHP, Swift и других), а также специальный форум, на котором участники делятся созданными программами.

30 самых удивительных проектов по машинному обучению

Платформа Mybridge проанализировала около 8800 прошлогодних проектов по машинному обучению с открытым исходным кодом и выбрала топ-30. В этом списке перечислены лучшие библиотеки для машинного обучения, датасеты и приложения, опубликованные в период с января по декабрь 2020 года. При оценке учитывались популярность, новизна и активность.

1. FastText

Библиотека для изучения вложений слов и текстовой классификации. [11786 звезд на Github] Создатель – Facebook Research.

2. Deep Photo Style Transfer

Программа для рендеринга фотографий с перенесением стилей с помощью нейросетей. [9747 звезд на Github] Создатель – Фудзюн Луань, профессор Корнеллского университета.

6-8 декабря 2020 пройдет хакатон Rosbank Tech.Madness. Нужно просто зарегистрироваться до 24.11 и ждать отбора. Описание идеи в заявке не требуется.

3. Face Recognition

Самый простой API для распознавания лиц для Python. [8672 звезды на Github] Создатель –Адам Гейтгей.

4. Magneta

Генерация музыки и живописи при помощи машинного интеллекта. [8113 звезд на Github].

5. Sonnet

Библиотека для работы с нейронными сетями, основанная на TensorFlow. [5731 звезда на Github] Создатель – Малкольм Рейнолдс из Deepmind.

6. deeplearn.js

Библиотека для машинного обучения, которая работает в браузере. [5462 звезды на Github] Создатель – Нихил Торат из Google Brain.

7. Fast Style Transfer in TensorFlow

Быстрая передача стиля с помощью TensorFlow. [4843 звезды на Github] Создатель – Логан Энгсторм из Массачусетского технологического института.

8. Pysc2

Среда обучения для StarCraft II. [3683 звезды на Github] Создатель – Тимо Эвальдс из DeepMind.

9. AirSim

Проект с открытым исходным кодом, созданный на Unreal Engine, который моделирует физику полета мультикоптера. [3861 звезда на Github] Создатель – Шитал Шах из Microsoft.

10. Facets

Визуализации для датасетов машинного обучения. [3371 звезда на Github] Создатель – Google Brain.

11. Style2Paints

ИИ-раскраска изображений. [3310 звезд на Github].

12. Tensor2Tensor

Унифицированная модель глубинного обучения, которая способна решать задачи из разных областей – Google Research. [3087 звезд на Github] Создатель – Райан Сепасси из Google Brain.

13. Image-to-image translation in PyTorch

Image-to-image трансформация рисунков. Например, трансформация лошадей в зебр, картины Моне — в фотографию, летнего пейзажа — в зимний и т.д. [2847 звезд на Github] Создатель – Дзюн-Ян Зу, профессор Калифорнийского университета в Беркли.

14. Faiss

Библиотека для эффективного поиска подобия и кластеризации векторов. [2629 звезд на Github] Создатель – Facebook Research.

15. Fashion-mnist

База данных продуктов моды для машинного обучения. [2780 звезд на Github] Создатель – Хань Сяо, исследователь Zalando Tech.

16. ParlAI

Основа для обучения и оценки моделей ИИ на наборе данных из множества диалогов. [2578 звезд на Github] Создатель – Александр Миллер из Facebook Research.

17. Fairseq

Сверточная нейронная сеть для машинного перевода. [2571 звезда на Github] Создатель – Facebook AI.

18. Pyro

Глубокое универсальное вероятностное программирование с Python и PyTorch. [2387 звезд на Github] Создатель – Uber AI Labs.

19. iGAN

Интерактивная генерация изображений. [2369 звезд на Github].

20. Deep-image-prior

Восстановление изображений с помощью нейронных сетей, но без обучения. [2188 звезд на Github] Создатель – Дмитрий Ульянов из Сколковского института науки и технологий.

21. Face_ >Обнаружение лиц в реальном времени и эмоциональная/гендерная классификация с использованием наборов данных fer2013/IMDB. [1967 звезд на Github].

22. Speech-to-Text-WaveNet

End-to-end распознавание речи на английском языке с использованием WaveNet и tensorflow. [1961 звезда на Github] Создатель – Намджу Ким из Kakao Brain.

23. StarGAN

Объединенные генеративно-состязательные сети для многопрофильной трансформации изображений. [1954 звезды на Github] .Создатель – Юньдзей Чхве из Университета Корё.

24. ML-agents

Плагин с открытым кодом, который является средой для обучения агентов в Unity. [1658 звезд на Github] Создатель – Артур Юлиани.

25. DeepV >Платформа для поиска и аналитики визуальных данных. [1494 звезды на Github] Создатель – Акшай Бхат, профессор Корнеллского университета.

26. OpenNMT

Открытая система машинного перевода, использующая методы машинного обучения. Для построения нейронной сети проект использует возможности библиотеки глубинного машинного обучения Torch. [1490 звезд на Github].

27. Pix2pixHD

Фотореалистичный синтез и преобразование изображений с высоким разрешением (2048×1024). [1283 звезды на Github] Создатель – Мин-Ю Лиу из Nvidia.

28. Horovod

Фреймворк распределенного обучения для TensorFlow. [1188 звезд на Github] Создатель – Uber Engineering.

29. AI-Blocks

Мощный и интуитивно понятный WYSIWYG-интерфейс, который позволяет любому человеку создавать модели для машинного обучения. [899 звезд на Github].

30. Deep neural networks for voice conversion in Tensorflow

Глубокие нейронные сети для передачи стиля голоса. [845 звезд на Github]. Создатель – Даби Ань из Kakao Brain.

Материалы по теме:

Почему проваливаются проекты по машинному обучению

Бенедикт Эванс: «Мы не до конца понимаем возможности машинного обучения»

Как мы научили нейронку распознавать пол и возраст

Кто извлечет максимальную пользу из искусственного интеллекта: корпорации, стартапы, страны?

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Яндекс: подборка полезных образовательных материалов на январь

Яндекс поделился свежей подборкой полезных материалов и анонсов образовательных мероприятий на январь 2020 года.

Мероприятия

  • 22 января пройдет вебинар «Все о биддерах в Яндекс.Директе». Четыре спикера с разными точками зрения по вопросу биддеров помогут слушателям разобраться, как работать с разными инструментами автоматизации управления ставками. Вебинар стартует в 12:00 по московскому времени. Участие бесплатное, по регистрации.
  • 24 января состоится вебинар «Ретаргетинг в Яндекс.Директе: от основ до анализа эффективности». Эксперт Яндекса по обучению Никита Кравченко расскажет, как правильно сегментировать аудиторию сайта, настраивать ретаргетинговые кампании и анализировать результаты. Участие бесплатное, по регистрации.
  • С 28 января по 6 февраля пройдет курс курс «Яндекс.Директ: подготовка к сертификации». Его проведут эксперт по обучению Александр Ярощук и его коллега из MediaGuru Анастасия Можаева. Курс рассчитан на тех, кто хочет стать сертифицированным специалистом по Директу. Участие бесплатное, нужна регистрация.

Новое на канале «Обучение рекламным технологиям»

Добавили запись вебинара «Видеореклама от Яндекса: технологии, доступные каждому». Команда Яндекса рассказала о том, как решать имиджевые и перформанс-задачи с помощью Видеосети Яндекса и как правильно оценивать эффективность кампании.

Источник: Пресс-релиз Яндекса

Случилось что-то важное? Поделитесь новостью с редакцией.

Книги и учебные ресурсы по машинному обучению

Посоветуйте какие-нибудь хорошие книги по математике и машинному обучению. Желательно в доступной для понимания форме.

Дописывайте, если есть что добавить в общий ответ.

2 ответа 2

Прежде чем заниматься конкретно машинным обучением, рекомендуем ознакомиться с книгами

Стюарт Рассел, Питер Норвиг Искусственный интеллект. Современный подход источник

Джордж Ф. Люгер Искусственный интеллект. Стратегии и методы
решения сложных проблем
источник

таким образом у вас сформируется более четкое понимание предметной области машинного обучения и сильно расширит ваш кругозор. Нейронные сети занимают важную позицию в машинном обучении, поэтому стоит ознакомиться с книгой

  • Саймон Хайкин Нейронные сети. Полный курсисточник

Также вы должны уметь производить предварительный анализ данных, чтобы понять, какие методы машинного обучения можно применить к вашему набору данных или как его лучше подготовить, в этом вам помогут следующие книги:

Борис Миркин Введение в анализ данных. Учебник и практикум источник

Марина Архипова, Татьяна Дуброва Анализ данных. Учебник источник

Уэс Маккинни Python и анализ данных источник (практика)

Роберт И. Кабаков R в действии. Анализ и визуализация данных на языке R источник (практика)

Вы должны знать хорошо математику (в особенности линейную алгебру), статистику, теорию вероятностей, дискретную математику. Я, например, неважно знаю математику и мне очень тяжело читать стандартные учебники, рассчитанные на то, что преподаватель сможет разжевать скупое описание формулы, поэтому для легкого порога вхождения рекомендую следующие книги (от основ и выше):

Стивен Х. Строгац Удовольствие от x. Увлекательная экскурсия в мир математики от одного из лучших преподавателей в мире источник

Юрий Шиханович Введение в современную математику. Начальные понятия источник

Рональд Л. Грэхем, Дональд Эрвин Кнут Конкретная математика. Математические основы информатики источник

Юрий Пухначев Математика без формул книга1, книга2

Тарасов Л.В. Азбука математического анализа. Беседы об основных понятиях. Учебное пособие источник

Анатолий Мышкис Лекции по высшей математике источник

Рихард Курант, Герберт Роббинс Что такое математика? источник

Потом уже можно браться за стандартный учебник математического анализа

  • Фихтенгольц Г.М.Основы математического анализаисточник

Книги на русском языке

Джеймс Г., Уиттон Д., Хасти Т., Тибширани Р. Введение в статистическое обучение с примерами на языке R источник, Оглавление и отрывки из глав

Себастьян Рашка Python и машинное обучение источник

Хенрик Бринк, Джозеф Ричардс Машинное обучение источник

Хараламбос Марманис, Дмитрий Бабенко Алгоритмы интеллектуального Интернета. Передовые методики сбора, анализа и обработки данных источник

К. В. Воронцов Математические методы обучения по прецедентам (теория обучения машин) источник

Мерков А.Б. Введение в методы статистического обучения источник

Аркадий Гелиг, Алексей Матвеев Введение в математическую теорию обучаемых распознающих систем и нейронных сетей. Учебное пособие источник

Мерков А.Б. Построение и обучение вероятностных моделей источник

Ричарт В., Коэльо П.Л. Построение систем машинного обучения на языке Python источник, Оглавление и отрывки из глав (тут больше практика по машинному обучению)

Вьюгин В. Математические основы машинного обучения и прогнозирования источник

Червоненкис А.Я. Теория обучения машин

Ричард С. Саттон, Эндрю Г. Барто Обучение с подкреплением источник

Андреас Мюллер, Сара Гвидо Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными источник

Дэви Силен, Арно Мейсман Основы Data Science и Big Data. Python и наука о данных источник

Лепский А.Е., Броневич А.Г. Математические методы распознавания образов: Курс лекций источник

Местецкий Л.М. Математические методы распознавания образов Курс лекций источник

Кристофер Д. Маннинг, Прабхакар Рагхаван Введение в информационный поиск источник

Юре Лесковец, Ананд Раджараман Анализ больших наборов данных источник, оглавление и отрывки из глав

Гудфеллоу Я., Бенджио И., Курвилль А. Глубокое обучение источник, оглавление и отрывки из глав

Шлезингер М.И. Десять лекций по статистическому и структурному распознаванию образов источник

Джулли А., Пал С. Библиотека Keras — инструмент глубокого обучения источник оглавление и отрывки из глав

Шарден Б., Массарон Л., Боскетти А. Крупномасштабное машинное обучение вместе с Python источник оглавление и отрывки из глав

Шитиков В.К., Мастицкий С.Э. Классификация, регрессия и другие алгоритмы Data Mining с использованием R источник , эл.версия

Дж. Вандер Плас Python для сложных задач. Наука о данных и машинное обучение источник

Даррен Кук Машинное обучение с использованием библиотеки Н2О источник оглавление и отрывки из глав

Открытый курс OpenDataScience по машинному обучению источник — статьи на Хабрахабре

Слайды лекций по курсу “Машинное обучение” источник

Лекция 2008 года Н.Ю. Золотых Как обучаются машины? источник, презентация к лекциям от 2020 г.

Тарик Рашид Создаем нейронную сеть источник

Николенко С. И., Кадурин А. А., Архангельская Е. О. Глубокое обучение источник

С. И. Николенко, А. Л. Тулупьев Самообучающиеся системы источник

Паттерсон Дж., Гибсон А. Глубокое обучение с точки зрения практика источник, оглавление и отрывки из глав

Орельен Жерон Прикладное машинное обучение с помощью Scikit-Learn и TensorFlow. Концепции, инструменты и техники для создания интеллектуальных систем источник, оглавление, отрывки из глав

П.Е. Овчинников Применение искусственных нейронных сетей для обработки сигналов. Учебно-методическое пособие. 2012г источник

Франсуа Шолле Глубокое обучение на R источник, оглавление, отрывки из глав

О`Нил, Шатт Data Science. Инсайдерская информация для новичков. Включая язык R источник

Шай Шалев-Шварц, Шай Бен-Давид Идеи машинного обучения источник, оглавление и отрывки из глав

Франсуа Шолле Глубокое обучение на Python источник

Пратик Джоши Искусственный интеллект с примерами на Python источник

Бенгфорт Б., Билбро Р., Охеда Т. Прикладной анализ текстовых данных на Python. Машинное обучение и создание приложений обработки естественного языка источник

Келлехер Дж., Мак-Нейми Б., д`Арси А. Основы машинного обучения для аналитического прогнозирования: алгоритмы, рабочие примеры и тематические исследования источник

Видео на русском языке

  • Высшая школа экономики «Введение в машинное обучение»источник Coursera
  • Специализация Машинное обучение и анализ данных включающая себя 6 курсов : источник Coursera
  • Видеолекции курса «Машинное обучение» от Школы анализа данных Яндекса источник на яндексе или источник на ютубе
  • Специализация Анализ Данных от Stepik (часть курсов из этой специализации отображена тут)
  • Курс Р.В. Шамина Машинное обучение и искусственный интеллект в математике и приложенияхисточник
  • Виктор Кантор МФТИ Машинное обучениеисточник
  • Курс от Stepik Нейронные сетиисточник
  • Видеолекциии (13шт.) Введение в анализ данныхисточник Mail.ru

Видеолекциии (1 семестр) Data Minig источник Mail.ru

Видеолекциии (2 семестр) Data Minig источник Mail.ru

Искусственный интеллект и машинное обучение (лекции) источник — сайт, ютуб


Канал OpenDataScience по машинному обучению и MLClass источник ютуб

Сергей Николенко Основы байесовского вывода источник ютуб

Технострим Mail.Ru Нейронные сети в машинном обучении (осень 2020) источник

Андрей Созыкин Онлайн курс Программирование глубоких нейронных сетей на Python источник сайт, ютуб

Биофармкластер «Северный» Машинное обучение 11 лекций на тему ML источник ютуб, к сожалению отдельного плейлиста нет, поэтому придется лекции не найденные через поиск искать в общем плейлисте самому.

Курс на 9 недель от ВШЭ и Яндекса Practical Reinforcement Learning (сами видео лекций и практических семинаров на русском языке найдете в разделе Materials каждой недели) источник github

Информационный поиск (осень 2020) источник

Ивахненко А.А. Введение в теорию нейросетей и глубокое обучение источник

Python для анализа данных источник Coursera

Семинары по машинному обучению JetBrains Research источник

Онлайн курсы, видеокурсы по математике и статистике

  • Высшая школа экономики, курс Линейная алгебраисточник Coursera
  • Лекториум Линейная алгебра и аналитическая геометрияисточник ютуб
  • Лекторий МФТИ Линейная алгебраисточник
  • МФТИ, курс Теория вероятностей для начинающихисточник Coursera
  • МФТИ, курс Математика для всехисточник Coursera
  • Курс от Stepik Основы статистикичасть1,часть2, часть3
  • Курс от Stepik Математическая статистикаисточник
  • Курс от Stepik Введение в дискретную математикуисточник
  • Курс от Stepik Ликбез по дискретной математикеисточник
  • Курс от Stepik Введение в математический анализисточник
  • Курс от Stepik Математический анализчасть1, часть2
  • Курс от Stepik Анализ данных в Rчасть1, часть2
  • Computer Science Center Анализ данных на R в примерах и задачах (весна 2020) источник ютуб
  • Computer Science Center Анализ данных на R в примерах и задачах, часть 2 (весна 2020) источник ютуб
  • Канал на ютубе Основы анализа данныхисточник
  • KhanAcademyRussian Теор. вероятн-ей и комбинаторикаисточник ютуб
  • Алгебра (133видео) источник KhanAcademyRussian
  • Р.В. Шамин. Математический анализ — лекцииисточник
  • кружок от ФПМИ МФТИ Школа глубокого обученияютуб, github, git2

На любителя:

Статистика, теория вероятностей:

Гнеденко Б.В., Хинчин А.Я. Элементарное введение в теорию вероятностей источник

Владимир Савельев Статистика и котики источник, немного почитать

Сара Бослаф Статистика для всех источник

Чарльз Уилан Голая статистика. Самая интересная книга о самой скучной науке источник

Эндрю Брюс, Питер Брюс Практическая статистика для специалистов Data Science источник , оглавление и фрагмент книги

Дж. Хей Введение в методы байесовского статистического вывода источник

Перечень будет периодически дополняться.

Топ лучших бесплатных книг по машинному обучению:

The Elements of Statistical Learning: Data Mining, Inference, and Prediction. В этой книге авторы попытались объединить много важных новых идей, связанных со статистическим обучением. Хотя в книге не хватает математических деталей, авторы неплохо объясняют именно основы концептов. Книга пригодится не только специалистам по статистике, но и людям, работающим в смежных областях.

Introduction To Machine Learning. Цель этой книги — введение в индуктивное логическое программирование, раздел науки на стыке машинного обучения и логического программирования. Книга будет полезна тем, кто изучает принципы работы с базами данных, дата-инжиниринг, ИИ, машинное обучение и логическое программирование.

Reinforcement Learning: An Introduction. Обучение с подкреплением — это один из способов машинного обучения, в ходе которого испытуемая система взаимодействует с некоторой средой и стремится получить максимальную награду за свои действия. В этой книге разбираются ключевые аспекты этого вида обучения, его история и сферы применения. Порогом вхождения в эту книгу является лишь базовый уровень знания принципов вероятностной модели.

Information Theory, Inference, and Learning Algorithms. В этой книге рассказывается о теории информации и о статистическом выводе. Эти темы лежат в основе таких областей современной науки, как коммуникация, теория обработки сигналов, data mining, машинное обучение, биоинформатика, криптография и многих других. Авторы удачно сочетают теоретические объяснения с практическими примерами и заданиями.

Gaussian Processes for Machine Learning. Эта книга посвящена гауссовским процессам и вопросу обучения с учителем. В книге приведено много алгоритмов, также разбираются сферы применения ГП в машинном обучении и статистике, например, в методе опорных векторов, нейронных сетях, сплайнах и прочем.

Bayesian Reasoning and Machine Learning. Эта книга пригодится студентам старших курсов с небольшим багажом знаний по линейной алгебре и матанализу. Материал в книге идёт от простого к сложному, используются графические модели.

A Course in Machine Learning. В этой книге приведен набор вводных материалов по большинству основных аспектов машинного обучения (обучение с учителем и без учителя, вероятностное моделирование, теория обучения и т.д.).

Machine Learning, Neural and Statistical Classification. Цель этой книги — рассказать о современных подходах к классификации. Они сравниваются по производительности и областям применения в реальных случаях. Как видно из названия, таких подходов три: статистический метод, метод машинного обучения и метод нейронных сетей.

Introduction To Machine Learning. В этой книге рассматриваются многие важные вопросы машинного обучения с 2006 года. Это и не учебник, и не задачник: цель книги — подготовить читателя к дальнейшему освоению этой темы.

Real-world Machine Learning. Henri Brink, Joseph W. Richards, Mark Fetherolf в данной книге авторы пытаются показать практическое применение машинного обучения в обыденных задачах, привести примеры их решения и собрать все важные знания для начинающего.

Карта мира машинного обучения

Лень читать лонгрид — повтыкайте хотя бы в картинку, будет полезно.

Думаю потом нарисовать полноценную настенную карту со стрелочками и объяснениями, что где используется, если статья зайдёт.

И да. Классифицировать алгоритмы можно десятком способов. Я выбрал этот, потому что он мне кажется самым удобным для повествования. Надо понимать, что не бывает так, чтобы задачу решал только один метод. Я буду упоминать известные примеры применений, но держите в уме, что «сын маминой подруги» всё это может решить нейросетями.

Начну с базового обзора. Сегодня в машинном обучении есть всего четыре основных направления.

Часть 1. Классическое обучение

Первые алгоритмы пришли к нам из чистой статистики еще в 1950-х. Они решали формальные задачи — искали закономерности в циферках, оценивали близость точек в пространстве и вычисляли направления.

Сегодня на классических алгоритмах держится добрая половина интернета. Когда вы встречаете блок «Рекомендованные статьи» на сайте, или банк блокирует все ваши деньги на карточке после первой же покупки кофе за границей — это почти всегда дело рук одного из этих алгоритмов.

Да, крупные корпорации любят решать все проблемы нейросетями. Потому что лишние 2% точности для них легко конвертируются в дополнительные 2 миллиарда прибыли. Остальным же стоит включать голову. Когда задача решаема классическими методами, дешевле реализовать сколько-нибудь полезную для бизнеса систему на них, а потом думать об улучшениях. А если вы не решили задачу, то не решить её на 2% лучше вам не особо поможет.

Знаю несколько смешных историй, когда команда три месяца переписывала систему рекомендаций интернет-магазина на более точный алгоритм, и только потом понимала, что покупатели вообще ей не пользуются. Большая часть просто приходит из поисковиков.

При всей своей популярности, классические алгоритмы настолько просты, что их легко объяснить даже ребёнку. Сегодня они как основы арифметики — пригождаются постоянно, но некоторые всё равно стали их забывать.

Классификация

«Разделяет объекты по заранее известному признаку. Носки по цветам, документы по языкам, музыку по жанрам»

Сегодня используют для:

  • Спам-фильтры
  • Определение языка
  • Поиск похожих документов
  • Анализ тональности
  • Распознавание рукописных букв и цифр
  • Определение подозрительных транзакций

Здесь и далее в комментах можно дополнять эти блоки. Приводите свои примеры задач, областей и алгоритмов, потому что описанные мной взяты из субъективного опыта.

Классификация вещей — самая популярная задача во всём машинном обучении. Машина в ней как ребёнок, который учится раскладывать игрушки: роботов в один ящик, танки в другой. Опа, а если это робот-танк? Штош, время расплакаться и выпасть в ошибку.

Для классификации всегда нужен учитель — размеченные данные с признаками и категориями, которые машина будет учиться определять по этим признакам. Дальше классифицировать можно что угодно: пользователей по интересам — так делают алгоритмические ленты, статьи по языкам и тематикам — важно для поисковиков, музыку по жанрам — вспомните плейлисты Спотифая и Яндекс.Музыки, даже письма в вашем почтовом ящике.

Раньше все спам-фильтры работали на алгоритме Наивного Байеса. Машина считала сколько раз слово «виагра» встречается в спаме, а сколько раз в нормальных письмах. Перемножала эти две вероятности по формуле Байеса, складывала результаты всех слов и бац, всем лежать, у нас машинное обучение!

Позже спамеры научились обходить фильтр Байеса, просто вставляя в конец письма много слов с «хорошими» рейтингами. Метод получил ироничное название Отравление Байеса, а фильтровать спам стали другими алгоритмами. Но метод навсегда остался в учебниках как самый простой, красивый и один из первых практически полезных.

Возьмем другой пример полезной классификации. Вот берёте вы кредит в банке. Как банку удостовериться, вернёте вы его или нет? Точно никак, но у банка есть тысячи профилей других людей, которые уже брали кредит до вас. Там указан их возраст, образование, должность, уровень зарплаты и главное — кто из них вернул кредит, а с кем возникли проблемы.

Да, все догадались, где здесь данные и какой надо предсказать результат. Обучим машину, найдём закономерности, получим ответ — вопрос не в этом. Проблема в том, что банк не может слепо доверять ответу машины, без объяснений. Вдруг сбой, злые хакеры или бухой админ решил скриптик исправить.

Для этой задачи придумали Деревья Решений. Машина автоматически разделяет все данные по вопросам, ответы на которые «да» или «нет». Вопросы могут быть не совсем адекватными с точки зрения человека, например «зарплата заёмщика больше, чем 25934 рубля?», но машина придумывает их так, чтобы на каждом шаге разбиение было самым точным.

Так получается дерево вопросов. Чем выше уровень, тем более общий вопрос. Потом даже можно загнать их аналитикам, и они навыдумывают почему так.

Деревья нашли свою нишу в областях с высокой ответственностью: диагностике, медицине, финансах.

Два самых популярных алгоритма построения деревьев — CART и C4.5.

В чистом виде деревья сегодня используют редко, но вот их ансамбли (о которых будет ниже) лежат в основе крупных систем и зачастую уделывают даже нейросети. Например, когда вы задаете вопрос Яндексу, именно толпа глупых деревьев бежит ранжировать вам результаты.

Но самым популярным методом классической классификации заслуженно является Метод Опорных Векторов (SVM). Им классифицировали уже всё: виды растений, лица на фотографиях, документы по тематикам, даже странных Playboy-моделей. Много лет он был главным ответом на вопрос «какой бы мне взять классификатор».

Идея SVM по своей сути проста — он ищет, как так провести две прямые между категориями, чтобы между ними образовался наибольший зазор. На картинке видно нагляднее:

У классификации есть полезная обратная сторона — поиск аномалий. Когда какой-то признак объекта сильно не вписывается в наши классы, мы ярко подсвечиваем его на экране. Сейчас так делают в медицине: компьютер подсвечивает врачу все подозрительные области МРТ или выделяет отклонения в анализах. На биржах таким же образом определяют нестандартных игроков, которые скорее всего являются инсайдерами. Научив компьютер «как правильно», мы автоматически получаем и обратный классификатор — как неправильно.

Сегодня для классификации всё чаще используют нейросети, ведь по сути их для этого и изобрели.

Правило буравчика такое: сложнее данные — сложнее алгоритм. Для текста, цифр, табличек я бы начинал с классики. Там модели меньше, обучаются быстрее и работают понятнее. Для картинок, видео и другой непонятной бигдаты — сразу смотрел бы в сторону нейросетей.

Лет пять назад еще можно было встретить классификатор лиц на SVM, но сегодня под эту задачу сотня готовых сеток по интернету валяются, чо бы их не взять. А вот спам-фильтры как на SVM писали, так и не вижу смысла останавливаться.

Регрессия

«Нарисуй линию вдоль моих точек. Да, это машинное обучение»

Сегодня используют для:

  • Прогноз стоимости ценных бумаг
  • Анализ спроса, объема продаж
  • Медицинские диагнозы
  • Любые зависимости числа от времени

Регрессия — та же классификация, только вместо категории мы предсказываем число. Стоимость автомобиля по его пробегу, количество пробок по времени суток, объем спроса на товар от роста компании и.т.д. На регрессию идеально ложатся любые задачи, где есть зависимость от времени.

Регрессию очень любят финансисты и аналитики, она встроена даже в Excel. Внутри всё работает, опять же, банально: машина тупо пытается нарисовать линию, которая в среднем отражает зависимость. Правда, в отличии от человека с фломастером и вайтбордом, делает она это математически точно — считая среднее расстояние до каждой точки и пытаясь всем угодить.

Когда регрессия рисует прямую линию, её называют линейной, когда кривую — полиномиальной. Это два основных вида регрессии, дальше уже начинаются редкоземельные методы. Но так как в семье не без урода, есть Логистическая Регрессия, которая на самом деле не регрессия, а метод классификации, от чего у всех постоянно путаница. Не делайте так.

Схожесть регрессии и классификации подтверждается еще и тем, что многие классификаторы, после небольшого тюнинга, превращаются в регрессоры. Например, мы можем не просто смотреть к какому классу принадлежит объект, а запоминать, насколько он близок — и вот, у нас регрессия.

Для желающих понять это глубже, но тоже простыми словами, рекомендую цикл статей Machine Learning for Humans

Обучение без учителя

Обучение без учителя (Unsupervised Learning) было изобретено позже, аж в 90-е, и на практике используется реже. Но бывают задачи, где у нас просто нет выбора.

Размеченные данные, как я сказал, дорогая редкость. Но что делать если я хочу, например, написать классификатор автобусов — идти на улицу руками фотографировать миллион сраных икарусов и подписывать где какой? Так и жизнь вся пройдёт, а у меня еще игры в стиме не пройдены.

Когда нет разметки, есть надежда на капитализм, социальное расслоение и миллион китайцев из сервисов типа Яндекс.Толока, которые готовы делать для вас что угодно за пять центов. Так обычно и поступают на практике. А вы думали где Яндекс берёт все свои крутые датасеты?

Либо, можно попробовать обучение без учителя. Хотя, честно говоря, из своей практики я не помню чтобы где-то оно сработало хорошо.

Обучение без учителя, всё же, чаще используют как метод анализа данных, а не как основной алгоритм. Специальный кожаный мешок с дипломом МГУ вбрасывает туда кучу мусора и наблюдает. Кластеры есть? Зависимости появились? Нет? Ну штош, продолжай, труд освобождает. Тыж хотел работать в датасаенсе.

Кластеризация

«Разделяет объекты по неизвестному признаку. Машина сама решает как лучше»

Сегодня используют для:

  • Сегментация рынка (типов покупателей, лояльности)
  • Объединение близких точек на карте
  • Сжатие изображений
  • Анализ и разметки новых данных
  • Детекторы аномального поведения

m.neumann/sp2020/cse517/lecturenotes/images/c22kmeans/TimoKmeans.png Всего у нас получается 256 * 256 * 256 = 16 777 216 возможных точек, где может оказаться каждый пиксель изображения, и столько же уникальных цветов(!). А нам-то нужно всего 32. 1. Мы рандомно закидываем в это 3D-пространство 32 центроида (пока еще не обладающие цветовым кодом. Пока что они нужны нам только для первичной кластеризации «3D-взвеси») 2. Далее смотрим, к какому из центроидов каждый пиксель нашей «взвеси» находится ближе. То есть тупо по трем дименшенам. Получаем кластеры первого порядка 3. Далее перемещаем центроиды внутри наших получившихся 32 кластеров первого порядка. Перемещаем так, чтобы центроиды реально были центроидами и были равноудалены от каждой точки в кластере 4. Смотрим, не изменили ли некоторые пиксели принадлежность к кластеру. Ведь в предыдущем шаге 32 центроида переместлись. Наверняка некоторые пиксели оказались теперь ближе к другому центроиду. Границы кластеров чуть-чуть изменились после этого шага за счет смены некоторыми пикселями принадлежности к кластеру 5. Повторяются шаги 3-4 до тех пор, пока не окажется, что центроиды уже не двигаются на шаге 3. То есть они и так уже равноудалены. Когда центроиды окончательно останавливаются, пункт 4 уже неактуален, т.к. изменений нет. Переходим к пункту 6 6. Прекращение перемещения центроидов означает, что у нас есть хорошие сбитые математически выверенные кластеры, сформированные вокруг них. 7. Теперь мы просто смотрим координаты каждого из 32 центроидов. Например (38, 228, 238). И все пиксели, которые у нас были «скластеризованы» вокруг него, перекрашиваем в данный RGB-цвет. 8. Возвращаем все пиксели на место. Готово. У вас 32-цветовое изображение. Вы великолепны! Если где-то ошибся, пардон. Исправьте, если не прав. PS Кстати, нашел ссылку на изображение, содержащее все 16 777 216 RGB-цветов: https://davidnaylor.org/temp/all16777216rgb-diagonal.png

Кластеризация — это классификация, но без заранее известных классов. Она сама ищет похожие объекты и объединяет их в кластеры. Количество кластеров можно задать заранее или доверить это машине. Похожесть объектов машина определяет по тем признакам, которые мы ей разметили — у кого много схожих характеристик, тех давай в один класс.

Отличный пример кластеризации — маркеры на картах в вебе. Когда вы ищете все крафтовые бары в Москве, движку приходится группировать их в кружочки с циферкой, иначе браузер зависнет в потугах нарисовать миллион маркеров.

Более сложные примеры кластеризации можно вспомнить в приложениях iPhoto или Google Photos, которые находят лица людей на фотографиях и группируют их в альбомы. Приложение не знает как зовут ваших друзей, но может отличить их по характерным чертам лица. Типичная кластеризация.

Правда для начала им приходится найти эти самые «характерные черты», а это уже только с учителем.

Сжатие изображений — еще одна популярная проблема. Сохраняя картинку в PNG, вы можете установить палитру, скажем, в 32 цвета. Тогда кластеризация найдёт все «примерно красные» пиксели изображения, высчитает из них «средний красный по больнице» и заменит все красные на него. Меньше цветов — меньше файл.

Проблема только, как быть с цветами типа Cyan ◼︎ — вот он ближе к зеленому или синему? Тут нам поможет популярный алгоритм кластеризации — Метод К-средних (K-Means). Мы случайным образом бросаем на палитру цветов наши 32 точки, обзывая их центроидами. Все остальные точки относим к ближайшему центроиду от них — получаются как бы созвездия из самых близких цветов. Затем двигаем центроид в центр своего созвездия и повторяем пока центроиды не перестанут двигаться. Кластеры обнаружены, стабильны и их ровно 32 как и надо было.

Искать центроиды удобно и просто, но в реальных задачах кластеры могут быть совсем не круглой формы. Вот вы геолог, которому нужно найти на карте схожие по структуре горные породы — ваши кластеры не только будут вложены друг в друга, но вы ещё и не знаете сколько их вообще получится.

Хитрым задачам — хитрые методы. DBSCAN, например. Он сам находит скопления точек и строит вокруг кластеры. Его легко понять, если представить, что точки — это люди на площади. Находим трёх любых близко стоящих человека и говорим им взяться за руки. Затем они начинают брать за руку тех, до кого могут дотянуться. Так по цепочке, пока никто больше не сможет взять кого-то за руку — это и будет первый кластер. Повторяем, пока не поделим всех. Те, кому вообще некого брать за руку — это выбросы, аномалии. В динамике выглядит довольно красиво:

Как и классификация, кластеризация тоже может использоваться как детектор аномалий. Поведение пользователя после регистрации резко отличается от нормального? Заблокировать его и создать тикет саппорту, чтобы проверили бот это или нет. При этом нам даже не надо знать, что есть «нормальное поведение» — мы просто выгружаем все действия пользователей в модель, и пусть машина сама разбирается кто тут нормальный.

Работает такой подход, по сравнению с классификацией, не очень. Но за спрос не бьют, вдруг получится.

Уменьшение Размерности (Обобщение)

«Собирает конкретные признаки в абстракции более высокого уровня»

Сегодня используют для:

  • Рекомендательные Системы (★)
  • Красивые визуализации
  • Определение тематики и поиска похожих документов
  • Анализ фейковых изображений
  • Риск-менеджмент

Изначально это были методы хардкорных Data Scientist’ов, которым сгружали две фуры цифр и говорили найти там что-нибудь интересное. Когда просто строить графики в экселе уже не помогало, они придумали напрячь машины искать закономерности вместо них. Так у них появились методы, которые назвали Dimension Reduction или Feature Learning.

Проецируем 2D-данные на прямую (PCA)

Для нас практическая польза их методов в том, что мы можем объединить несколько признаков в один и получить абстракцию. Например, собаки с треугольными ушами, длинными носами и большими хвостами соединяются в полезную абстракцию «овчарки». Да, мы теряем информацию о конкретных овчарках, но новая абстракция всяко полезнее этих лишних деталей. Плюс, обучение на меньшем количестве размерностей идёт сильно быстрее.

Инструмент на удивление хорошо подошел для определения тематик текстов (Topic Modelling). Мы смогли абстрагироваться от конкретных слов до уровня смыслов даже без привлечения учителя со списком категорий. Алгоритм назвали Латентно-семантический анализ (LSA), и его идея была в том, что частота появления слова в тексте зависит от его тематики: в научных статьях больше технических терминов, в новостях о политике — имён политиков. Да, мы могли бы просто взять все слова из статей и кластеризовать, как мы делали с ларьками выше, но тогда мы бы потеряли все полезные связи между словами, например, что батарейка и аккумулятор, означают одно и то же в разных документах.

Точность такой системы — полное дно, даже не пытайтесь.

Нужно как-то объединить слова и документы в один признак, чтобы не терять эти скрытые (латентные) связи. Отсюда и появилось название метода. Оказалось, что Сингулярное разложение (SVD) легко справляется с этой задачей, выявляя для нас полезные тематические кластеры из слов, которые встречаются вместе.

Другое мега-популярное применение метода уменьшения размерности нашли в рекомендательных системах и коллаборативной фильтрации (у меня был пост про их виды). Оказалось, если абстрагировать ими оценки пользователей фильмам, получается неплохая система рекомендаций кино, музыки, игр и чего угодно вообще.

Полученная абстракция будет с трудом понимаема мозгом, но когда исследователи начали пристально рассматривать новые признаки, они обнаружили, что какие-то из них явно коррелируют с возрастом пользователя (дети чаще играли в Майнкрафт и смотрели мультфильмы), другие с определёнными жанрами кино, а третьи вообще с синдромом поиска глубокого смысла.

Машина, не знавшая ничего кроме оценок пользователей, смогла добраться до таких высоких материй, даже не понимая их. Достойно. Дальше можно проводить соцопросы и писать дипломные работы о том, почему бородатые мужики любят дегенеративные мультики.

На эту тему есть неплохая лекция Яндекса — Как работают рекомендательные системы

Поиск правил (ассоциация)

«Ищет закономерности в потоке заказов»

Сегодня используют для:

  • Прогноз акций и распродаж
  • Анализ товаров, покупаемых вместе
  • Расстановка товаров на полках
  • Анализ паттернов поведения на веб-сайтах

Сюда входят все методы анализа продуктовых корзин, стратегий маркетинга и других последовательностей.

Предположим, покупатель берёт в дальнем углу магазина пиво и идёт на кассу. Стоит ли ставить на его пути орешки? Часто ли люди берут их вместе? Орешки с пивом, наверное да, но какие ещё товары покупают вместе? Когда вы владелец сети гипермаркетов, ответ для вас не всегда очевиден, но одно тактическое улучшение в расстановке товаров может принести хорошую прибыль.

То же касается интернет-магазинов, где задача еще интереснее — за каким товаром покупатель вернётся в следующий раз?

По непонятным мне причинам, поиск правил — самая хреново продуманная категория среди всех методов обучения. Классические способы заключаются в тупом переборе пар всех купленных товаров с помощью деревьев или множеств. Сами алгоритмы работают наполовину — могут искать закономерности, но не умеют обобщать или воспроизводить их на новых примерах.

В реальности каждый крупный ритейлер пилит свой велосипед, и никаких особых прорывов в этой области я не встречал. Максимальный уровень технологий здесь — запилить систему рекомендаций, как в пункте выше. Хотя может я просто далёк от этой области, расскажите в комментах, кто шарит?

Часть 2. Обучение с подкреплением

«Брось робота в лабиринт и пусть ищет выход»

Сегодня используют для:

  • Самоуправляемых автомобилей
  • Роботов пылесосов
  • Игр
  • Автоматической торговли
  • Управления ресурсами предприятий

Наконец мы дошли до вещей, которые, вроде, выглядят как настоящий искусственный интеллект. Многие авторы почему-то ставят обучение с подкреплением где-то между обучением с учителем и без, но я не понимаю чем они похожи. Названием?

Обучение с подкреплением используют там, где задачей стоит не анализ данных, а выживание в реальной среде.

Средой может быть даже видеоигра. Роботы, играющие в Марио, были популярны еще лет пять назад. Средой может быть реальный мир. Как пример — автопилот Теслы, который учится не сбивать пешеходов, или роботы-пылесосы, главная задача которых — напугать вашего кота до усрачки с максимальной эффективностью.

Знания об окружающем мире такому роботу могут быть полезны, но чисто для справки. Не важно сколько данных он соберёт, у него всё равно не получится предусмотреть все ситуации. Потому его цель — минимизировать ошибки, а не рассчитать все ходы. Робот учится выживать в пространстве с максимальной выгодой: собранными монетками в Марио, временем поездки в Тесле или количеством убитых кожаных мешков хихихих.

Выживание в среде и есть идея обучения с подкреплением. Давайте бросим бедного робота в реальную жизнь, будем штрафовать его за ошибки и награждать за правильные поступки. На людях норм работает, почему бы на и роботах не попробовать.

Умные модели роботов-пылесосов и самоуправляемые автомобили обучаются именно так: им создают виртуальный город (часто на основе карт настоящих городов), населяют случайными пешеходами и отправляют учиться никого там не убивать. Когда робот начинает хорошо себя чувствовать в искусственном GTA, его выпускают тестировать на реальные улицы.

Запоминать сам город машине не нужно — такой подход называется Model-Free. Конечно, тут есть и классический Model-Based, но в нём нашей машине пришлось бы запоминать модель всей планеты, всех возможных ситуаций на всех перекрёстках мира. Такое просто не работает. В обучении с подкреплением машина не запоминает каждое движение, а пытается обобщить ситуации, чтобы выходить из них с максимальной выгодой.

Помните новость пару лет назад, когда машина обыграла человека в Го? Хотя незадолго до этого было доказано, что число комбинаций физически невозможно просчитать, ведь оно превышает количество атомов во вселенной. То есть если в шахматах машина реально просчитывала все будущие комбинации и побеждала, с Го так не прокатывало. Поэтому она просто выбирала наилучший выход из каждой ситуации и делала это достаточно точно, чтобы обыграть кожаного ублюдка.

Эта идея лежит в основе алгоритма Q-learning и его производных (SARSA и DQN). Буква Q в названии означает слово Quality, то есть робот учится поступать наиболее качественно в любой ситуации, а все ситуации он запоминает как простой марковский процесс.

Машина прогоняет миллионы симуляций в среде, запоминая все сложившиеся ситуации и выходы из них, которые принесли максимальное вознаграждение. Но как понять, когда у нас сложилась известная ситуация, а когда абсолютно новая? Вот самоуправляемый автомобиль стоит у перекрестка и загорается зелёный — значит можно ехать? А если справа мчит скорая помощь с мигалками?

Ответ — хрен знает, никак, магии не бывает, исследователи постоянно этим занимаются, изобретая свои костыли. Одни прописывают все ситуации руками, что позволяет им обрабатывать исключительные случаи типа проблемы вагонетки. Другие идут глубже и отдают эту работу нейросетям, пусть сами всё найдут. Так вместо Q-learning’а у нас появляется Deep Q-Network (DQN).

Reinforcement Learning для простого обывателя выглядит как настоящий интеллект. Потому что ух ты, машина сама принимает решения в реальных ситуациях! Он сейчас на хайпе, быстро прёт вперёд и активно пытается в нейросети, чтобы стать еще точнее (а не стукаться о ножку стула по двадцать раз).

Потому если вы любите наблюдать результаты своих трудов и хотите популярности — смело прыгайте в методы обучения с подкреплением (до чего ужасный русский термин, каждый раз передёргивает) и заводите канал на ютюбе! Даже я бы смотрел.

Помню, у меня в студенчестве были очень популярны генетические алгоритмы (по ссылке прикольная визуализация). Это когда мы бросаем кучу роботов в среду и заставляем их идти к цели, пока не сдохнут. Затем выбираем лучших, скрещиваем, добавляем мутации и бросаем еще раз. Через пару миллиардов лет должно получиться разумное существо. Теория эволюции в действии.

Так вот, генетические алгоритмы тоже относятся к обучению с подкреплением, и у них есть важнейшая особенность, подтвержденная многолетней практикой — они нахер никому не нужны.

Человечеству еще не удалось придумать задачу, где они были бы реально эффективнее других. Зато отлично заходят как студенческие эксперименты и позволяют кадрить научруков «достижениями» особо не заморачиваясь. На ютюбе тоже зайдёт.

Подборка полезных материалов по машинному обучению (не для малышей)

Трудолюбивые и заботливые родители пользуются лучшими предложениями для своих детей, и поступают совершенно правильно. К сожалению, далеко не всегда лучшие решения — самые известные, детские сайты не являются исключением. Специалисты IQша помогут сделать правильный выбор среди наиболее достойных.

МААМ — сайт для практикующих педагогов, построен по типу блога. Матераилы для публикации присылают таланливейшие специалисты! Конспекты занятий и примеры оформления группы к праздникам, детские поделки и примеры игр пригодятся любому родителю, который занимается с ребенком дома и не устает придумывать новые тематические задания.
Раздел «Дошкольное образование» Учительского портала также представляет материалы специалистов: презентации, программы развития, планы и конспекты занятий. Неоспоримое преимущество этого контента — методическая продуманность, гарантия максимальной адаптации обучающего материала к психологии восприятия и обучения детей. Конечно же, вашему ребенку может что-то оказаться не интересным или не таким увлекательным, как вы бы хотели. Но на этом сайте есть из чего выбрать!
Развивающие игры для вашего голопуза — так называется сайт с небольшим количеством ярких, понятных малышам и содержательных флеш-игр. Игры представлены в разделах «Алфавит», «Цифры», «Логические», «Внимание и память», «Пазлы». Самые очевидные плюсы сайта — игры бесплатны, а на сайте нет рекламы! Минус в явно недостаточном количестве этих игр. Впрочем, если их дозировать, как и любую деятельность ребенка за компьютером, их хватит на много увлекательных вечеров!
«Играемся» — еще один сайт с обучающими бесплатными играми для детей. Игры разбиты на категории: на внимание и память, на логику и мышление, загадки и ребусы, пазлы, для малышей и другие. Реклама на сайте есть, но при правильном обращении со страницей ребенок может ее не заметить. Игры созданы на технологии flash и не будут работать на планшетах ipad.
Портал «Чудо-юдо» — настоящий клад развивающих материалов на любой вкус. Кроссворды и ребусы, лабиринты и прописи, скороговорки и аудиосказки, поделки и пазлы для малышей — каждый родитель найдет, чем заняться ребенку любого возраста! Сайт изобилует материалами для распечатывания и описаниями различных оффлайн-активностей. Даже если вы не будете пользоваться никаким другим сайтом для своего ребенка, вы обеспечите деятельность для домашних занятий на несколько лет вперед, потому что задания сайта растут вместе с ребенком.
Сайт «Развитие ребенка» — старожил в интернет-пространстве для детей и родителей. Команда профессиональных педагогов и психологов не устает радовать нас обзорами развивающих игрушек и книг, рекомендациями дидактических пособий, а также описаниями упражнений, которые доступны для выполнения не только в домашних условиях, но и за пределами дома. На сайте много развивающих карточек и раскрасок для распечатывания.
На этих электронных презентациях выросли детки, которые сейчас уже ходят в среднюю школу. Презентации высочайшего методического качества представлены во всем многообразии тем, которое только можно себе представить: еда, улица, история, музыкальные инструменты, животные и многое другое. Если ваш ребенок тянется к компьютеру, но еще мал для самостоятельных занятий — открывайте презентацию и начинайте вести короткие, понятные ребенку рассказы о каждом слайде. Вот увидите, ребенок полюбит эти учебные разговоры не меньше чтения книг!
На сайте «По складам» собраны уникальные игры на обучение детей чтению. Соединяя буквы, склады и слоги, дети сами не замечают, как начинают разбираться в принципах составления и чтения слов. Сайт монетизируется за счет рекламы, поэтому родителям необходимо настраивать окно, в котором ребенок выполняет задание, прежде чем усадить малыша за монитор. Но аналогов этим упражнениям в пространстве рунета практически нет. Игры разработаны на flash, поэтому будут недоступны для apple-устройств.
Развитие детей — максимально лаконичное и понятное название для сайта, на котором есть все необходимое неутомимому родителю. Сайт полон конкретных практических рецептов: как научить пересказывать текст, научить вырезать ножницами, писать цифры, организовать веселый день рождения и многое другое. Статьи в большинстве своем живые, написанные от души, а не для поисковых роботов — тем и притягивает внимание сайт.
Придумать со своими детьми и их друзьями развивающие праздники, стенгазеты и различные обучающие активности вам поможет «Почемучка». На этом сайте много конкурсов для родителей и детей, есть своя библиотека и даже музыка и мультфильмы. В разделе «Мамин клуб» все желающие мамы могут поделиться своими поделками и идеями. Есть и свой форум для обсуждения самых животрепещущих тем.

Дорогие родители, делитесь в комментариях ссылками на сайты для детей и родителей, которые вы считаете для себя незаменимыми!

Понравилось? Поделитесь с друзьями:

8 онлайн-курсов по машинному обучению

Anna Lukachuk

Поисковые системы Google и «Яндекс», подбор фильмов под вкусы пользователя, определение жанра композиции по звуковым частотам и даже распознавание в письме спама — все это возможно благодаря анализу больших данных. Обрабатывающие их алгоритмы должны быть или очень сложными, или самообучающимися. Как люди обучают системы и с чего начать свой путь в этой области, мы уже рассказывали. Для тех, кто хорошо знает высшую математику и умеет программировать (хотя бы на Python), — эти 8 онлайн-курсов.

Специализация: машинное обучение и анализ данных

Где и когда: онлайн в любое время (продолжительность — 3–6 месяцев)

Стоимость: 5385 рублей в месяц

Курс начинается с азов — фундаментальной математики и программирования на Python. Затем преподаватели расскажут, как использовать алгоритмы для конкретных бизнес-задач, например прогнозов спроса на товар или расчетов вероятности клика по рекламе. В конце обучения студенты создадут собственный проект по анализу данных для социальных сетей, электронной коммерции и др. Для выпускников доступна программа трудоустройства.

Практический Machine Learning

Организатор: Skill Factory

Где и когда: онлайн с 9 октября (продолжительность — 6 недель)

Стоимость: 54 000 рублей

От освоения Python и алгоритмов машинного обучения до мониторинга результатов и командной работы с жесткими дедлайнами — курс подойдет новичкам, которые хотят применять машинное обучение в бизнесе или начать карьеру data scientist. Те, кто никогда не программировал, могут подготовиться к обучению заранее — организаторы вышлют все необходимые материалы.

Машинное обучение для руководителей

Организатор: Фонд развития онлайн-образования

Где и когда: онлайн в любое время (продолжительность — 4 недели)

Стоимость: 25 000 рублей

Основы машинного обучения для руководителей, которые хотят внедрить в работу умные алгоритмы и технологии искусственного интеллекта. Как выбирать подрядчиков, контролировать ход цифровых проектов и определять эффективность машинного обучения для своего проекта — все для осознанных бизнес-решений.

Введение в машинное обучение

Организатор: НИУ ВШЭ, Школа анализа данных «Яндекса»

Где и когда: онлайн в любое время (продолжительность — 7 недель)

Стоимость: 1976 рублей

С какими задачами работает машинное обучение, как выбирать самые эффективные методы и где пригодятся нейронные сети — студенты освоят современный анализ данных на реальных примерах. Для прохождения курса обязательно знание функций, производных, векторов и матриц, а также умение программировать на Python.

Машинное обучение

Организатор: Stanford University

Где и когда: онлайн в любое время (продолжительность — 7 недель)

Стоимость: 4021 рубль

Слушатели познакомятся с основами машинного обучения, глубинного анализа данных и статистического распознавания образов. Мы рассказывали про машинное обучение «с учителем» и «без учителя» — в программе покажут, как это работает на реальных кейсах из Кремниевой долины. Новые навыки пригодятся в работе с интеллектуальными роботами, компьютерным зрением и медицинской информатикой.

Машинное обучение и основы ИИ

Организатор: Keith McCormick

Где и когда: онлайн в любое время (продолжительность — 2 часа лекций)

Работа с большими массивами данных — это всегда необходимость классифицировать, сокращать объем или восполнять недостаток. Курс посвящен 11 полезным алгоритмам для машинного обучения — от дискриминантного анализа и логистической регрессии до искусственных нейронных сетей.

Науки о данных: машинное обучение

Организатор: Harvard University

Где и когда: онлайн в любое время (продолжительность — 4 недели)

Стоимость: бесплатно (с сертификатом — $49)

Популярные алгоритмы машинного обучения, метод главных компонент и прогнозирование данных — курс подойдет тем, кто уже умеет работать с большими данными. Финальный проект — создание системы рекомендаций фильмов на основе предыдущих предпочтений. Если знаний пока не хватает, Гарвард предлагает базовое онлайн-обучение по работе с анализом данных.

Машинное обучение

Где и когда: онлайн в любое время (продолжительность — 3 месяца)

Бесплатный курс от старшего научного сотрудника Google Винсента Ванхоука о нейросетях: как строится их архитектура, зачем нужны сверточная и рекуррентная сети и в чем секрет обучения модели с долгой краткосрочной памятью. Продолжить обучение можно в программе Deep Learning.

Мастер Йода рекомендует:  Порочная связь уязвимость в Skype позволяет получить доступ к любому аккаунту, привязанному к
Добавить комментарий