10 лучших алгоритмов машинного обучения: почему они так важны в 2021 году?
Опубликовано: 2019-06-10Оглавление
В кроличью нору машинного обучения
Приложения из реальной жизни
Что означают алгоритмы машинного обучения?
Типы машинного обучения
10 лучших алгоритмов машинного обучения
Заворачивать
В 2021 году компьютеры смогут не только видеть , но и самостоятельно читать и писать .
Что ж, давайте посмотрим на современную историю ужасов, в которой мы живем.
Например, как бы вы отреагировали, если бы вам сказали, что скоро 30% рабочих мест будет заменено автоматизацией? Это возмутительно, не правда ли?
И какое это имеет отношение к алгоритмам машинного обучения ?
К счастью, в конце туннеля есть свет. Позвольте мне провести вас через это.
В 2021 году компьютеры смогут:
- Узнавайте голоса, лица и почерк. (Стиль CSI…)
- Подписывать изображения автоматически.
- Узнайте, как распознать содержание изображения и классифицировать его по определенным характеристикам.
- Делайте за вас задания. (И создайте необходимые алгоритмы для их реализации.)
Этот список, конечно же, можно продолжить.
Каждый день мы выполняем поиск в Интернете, посещаем веб-сайты и социальные сети. И мы никогда не задаемся фундаментальным вопросом:
Как далеко зашла технология искусственного интеллекта?
Вот так!
Достижения технологий поднимают вопросы о будущем человечества.
Возможно, эти факты дадут нам некоторое представление:
(Источник: футуризм , Дезирь )
- В Южной Корее на каждые 100 работников в среднем 4,78 человек составляют роботы .
- 88% сотрудников в Эфиопии рискуют потерять работу из-за роботов.
- В Нью-Йорке работники, находящиеся под угрозой исчезновения, составляют 40,7% .
- Для написания программы машинного обучения необходимо 9 строк кода.
- 97% рабочих мест по приготовлению фаст-фуда будет заменено машинами.
- 98% фермеров потеряют работу из-за техники.
- Машинное обучение может приносить фармацевтической промышленности до 1 миллиарда долларов в год.
- По оценкам, в следующие 10 лет машинное обучение заменит 25% рабочих мест.
В 2021 году мы действительно сможем владеть роботом дома.
Вы можете свободно поговорить с Джибо или Тапиа . Их неспроста называют социальными роботами .
Они запоминают имена, лица и голоса ваших друзей и членов семьи (что совсем не страшно!), Они могут присматривать за вашим ребенком (о, да!), И если у вас случится авария дома, они позвонят в службу 911 для ты. Последний может быть особенно полезен, когда рядом никого нет. Но мы вернемся к этому позже.
В настоящее время алгоритмы могут «учить себя» языкам и даже переводить разговорный английский на письменный китайский одновременно с беглостью среднего носителя китайского языка. Рано или поздно изучение иностранных языков неизбежно устареет.
А как насчет этого:
Наши смартфоны буквально шпионят за нами… Я уверен, что вы точно понимаете, о чем я говорю! Представьте себе - за обедом в офисе вы упоминаете (устно!), Что хотите начать смотреть Люцифера . Вернувшись за свой стол, вы открываете Pinterest или Facebook на своем телефоне, и вот он - сам Дьявол ... (Да, Том Эллис мечтательный, но не в этом суть!)
Системы рекомендаций повсюду вокруг нас. Если вы введете поисковый запрос «Лего», соответствующие изображения, которые появятся и классифицируются как Лего, были признаны таковыми ИИ. Другими словами, они не были аннотированы вручную, как блоки Lego , человеком ...
Алгоритм сам научился, что это такое, глядя на миллионы изображений.
Мурашки по коже!
Все эти возможности и многое другое уже используются компаниями.
Последствия здесь следующие:
Во-первых, компьютеры Учитесь , ребята! Подумайте обо всех роботах-рабочих в будущем. Они будут учиться и выполнять задачи НАМНОГО быстрее, чем люди.
И во- вторых - я знаю, о чем вы думаете - Боже, человечество так обречено!
Многие люди так реагируют.
Многие авторы прошлого века писали о будущем, в котором роботы будут доминировать над людьми. Искусственный интеллект процветает, роботы будут править миром и питаться людьми. Сингулярность близка.
Хорошо, это хорошее место, чтобы остановиться.
Теперь, когда у нас есть это из нашей системы, давайте посмотрим, что на самом деле правда.
В кроличью нору машинного обучения
Сначала нам нужен контекст.
15 000 лет назад была изобретена одна из самых любимых в мире игр. Где-то между 12 и 14 веками эта игра стала известна как шахматы .
Он имеет 10 в степени 40 возможных результатов (это 1 с 40 нулями в конце).
В 2017 году алгоритм Google AlphaZero использовал машинное обучение, чтобы научиться играть и побеждать в игре.
Весь процесс, от знакомства с игрой до алгоритма, до первой победы над Stockfish - одним из сильнейших шахматных движков в мире, занял:
(приготовьтесь!)
4 часа.
Ой!
Да, мы находимся на пороге революции машинного обучения .
Оглядываясь назад, можно сказать, что это не первое нарушение подобного рода. Промышленная революция в конце 19-го и начале 20-го веков действительно вызвала социальные потрясения, но в конечном итоге человечество и машины достигли равновесия.
Да, все меняется, и это действительно хорошо!
Программное обеспечение для машинного обучения позволяет взглянуть на проблему свежим взглядом и ориентироваться в неизведанной среде.
Итак, как мы сейчас увидим, это все-таки не страшилка.
Больше похоже на чудо техники.
Теперь:
Почему классификация так важна?
Для начала, что такое машинное обучение по определению ?
По сути, машина запрограммирована, чтобы научиться создавать программы и создавать решения. Машинное обучение всегда дает наиболее точные числа (и, при необходимости, прогнозы).
Подумайте о технологии, которая может решить широкий спектр совершенно разных проблем.
И в этом вся прелесть!
Основная цель системы - классифицировать . Это также называется компьютерным зрением . Он сам научится различать. А количество различных проблем в мире, которые можно свести к, казалось бы, простой задаче классификации, просто ошеломляет.
Только представьте себе возможность классифицировать между:
- Хорошие и плохие шахматные позиции (игровые)
- Грамматически правильные и неправильные предложения (перевод)
- Пустая дорога, по которой проезжают автомобили или пешеходы (беспилотные автомобили).
- Здоровая клетка и раковая клетка (медицинский диагноз)
Именно поэтому специалисты во многих областях станут устаревшими. Не нужно быть экспертом, чтобы создать код, который будет выполнять такие задачи. Ребята, которые написали программу синхронного перевода с английского на китайский, не знали ни слова по-китайски.
Алгоритм сам научится быть экспертом.
И да, важно узнать о них и познакомиться с ними… так же, как мы познакомились с компьютерами вначале.
Сейчас мы хорошо разбираемся в компьютерах. Настолько хороши, что мы склонны их антропоморфизировать (а может, это только я?).
Кажется, самое время спросить себя:
Что будет со всеми этими людьми, которые в конечном итоге потеряют работу из-за программ искусственного интеллекта и машинного обучения?
Вы слышали о такой маленькой вещи, которая называется универсальный базовый доход?
Вот оно:
В будущем граждане будут получать доход, не связанный с выполнением какой-либо работы. Деньги будут получены за счет безумной эффективности, которую обеспечит автоматизация, и за счет экономии на ней.
Либо это, либо - немного более реалистичный сценарий - появится много новых типов рабочих мест. В конце 19 века около 50% населения США было занято в сельском хозяйстве. Теперь, благодаря мощным машинам, менее 2% из них - фермеры, но люди работают.
Итак, для чего можно использовать машинное обучение ?
Приложения из реальной жизни
Машинное обучение можно использовать для вывода новых фактов из базы данных.
Давайте посмотрим некоторые из областей , где машинное обучение будет делать большую разницу:
- Помощь при вождении - автомобили могут автоматически тормозить за вас, когда вы приближаетесь к движущемуся впереди автомобилю. И поэтому в какой-то момент в будущем человечество почти забудет, что означает автомобильная авария . Едут беспилотные автомобили.
- Здравоохранение - повышает эффективность медицинских работников. Распознавание и диагностика заболеваний станет намного проще и точнее с помощью машинного обучения. Например, программы могут не только сканировать и идентифицировать изображения раковых тканей лучше, чем у людей, но они также могут рассчитывать выживаемость пациентов на основе огромных баз данных медицинских записей. (Посмотрите на работу Джереми Ховарда и его проект под названием Enlitic . Это потрясающе!)
- Изобретение лекарств - с помощью машинного обучения каждый пациент может получить лечение, разработанное специально для него.
- Сельское хозяйство - сельское хозяйство будет автоматизировано с помощью компьютерного зрения и роботизированного контроля: качество урожая и прогнозирование, обнаружение болезней, благополучие домашнего скота и производство.
- Языковые возможности на базе искусственного интеллекта - в ближайшем будущем мы сможем устно общаться с переводом в реальном времени с помощью искусственного интеллекта .
Машинное обучение - это всего лишь инструмент, и он останется им в обозримом будущем.
Так что не о чем беспокоиться. Устройтесь поудобнее и расслабьтесь.
Теперь, когда мы узнали, что такое машинное обучение, давайте зададим следующий вопрос:
Что означают алгоритмы машинного обучения?
Итак, после того, как мы установили, насколько важно и полезно для нашего будущего машинного обучения, давайте более подробно рассмотрим алгоритмы, которые делают волшебство возможным.
Отличный способ объяснить алгоритмы машинного обучения - сравнить их с традиционным программированием.
В традиционном программировании программист работает в команде с экспертом в той области, для которой разрабатывается программное обеспечение. Чем сложнее задача - тем длиннее код и сложнее будет его написание.
Совершенно иначе работают алгоритмы машинного обучения . Алгоритм получает набор данных для ввода и необязательный для вывода. Затем он анализирует его (или их) и разрабатывает процесс, который должен иметь место для получения полезного результата. Сегодня это работа, предназначенная для человека-программиста. В будущем это тоже изменится.
Типы машинного обучения
Есть 4 различных типа алгоритмов машинного обучения .
Они здесь:
1. Обучение с учителем
Входные данные в алгоритмах контролируемого обучения помечены, а выходные данные известны и точны. Чтобы использовать этот класс алгоритмов, вам понадобится большой объем помеченных данных. И это не всегда может быть легкой задачей.
Контролируемые алгоритмы делятся на две категории - регрессия и классификация . Каждый проверяет разные наборы данных.
Алгоритмы регрессии - это те, которые делают прогнозы и прогнозы. Среди прочего, они включают прогнозы погоды, прирост населения и оценки ожидаемой продолжительности жизни, рыночные прогнозы.
Алгоритмы классификации используются для диагностики, обнаружения мошенничества с идентификационными данными, удержания клиентов и, как следует из названия, для классификации изображений.
2. Обучение без учителя
Это происходит, когда входные данные не помечены. Они организуют данные в структуры кластеров. Таким образом, любые входные данные сразу готовы к анализу.
Поскольку данные не маркируются, невозможно оценить точность результата. Тем не менее, неконтролируемые алгоритмы не предназначены для достижения точности. Кластеры, которые создает алгоритм, никак не знакомы программе. Итак, идея состоит в том, чтобы вводить данные, анализировать их и группировать в кластеры.
Так же, как контролируемые алгоритмы, их неконтролируемые собратья делятся на 2 категории - уменьшение размерности и кластеризация .
Очевидно, что сами алгоритмы кластеризации являются частью всего этого. Полезно сгруппировать данные по категориям, чтобы вам не приходилось разбираться с каждой частью отдельно. Эти алгоритмы используются, прежде всего, для сегментации клиентов и целевого маркетинга.
Алгоритмы уменьшения размерности используются для обнаружения структур, визуализации больших данных, выявления признаков и значимого сжатия. Если кластеризация - это одна сторона медали, уменьшение размерности будет другой. Группируя данные в кластеры, алгоритмы неизбежно сокращают количество значимых переменных (измерений), которые описывают набор данных.
Теперь существует класс алгоритмов машинного обучения, который объединяет предыдущие 2 класса:
3. Полу-контролируемое обучение
Он стоит между контролируемыми с помеченными данными и неконтролируемыми алгоритмами с немаркированными данными .
Полуконтролируемые алгоритмы используют небольшой объем помеченных данных и большой объем немаркированных данных. Это может привести к повышению точности обучения.
Это также огромное облегчение с точки зрения сбора данных, поскольку для создания помеченных данных требуется много ресурсов.
4. Обучение с подкреплением
В отличие от трех предыдущих типов, алгоритмы подкрепления выбирают действие на основе набора данных. Затем они оценивают результат и при необходимости меняют стратегию.
В алгоритмах подкрепления вы создаете сеть и цикл действий, и все. Без создания базы данных у вас есть победитель. Почему?
Ну, это были алгоритмы подкрепления, которые разобрались в играх в шашки, шахматы и го.
Обучение с подкреплением работает по принципу проб и ошибок. Система получит вознаграждение, которое поможет измерить ее успешность. В случае игр - наградой будет табло. Каждый раз, когда система выигрывает очко, она оценивает это как успешный ход, и статус этого хода становится выше. Он будет повторять цикл до тех пор, пока все его движения не будут успешными.
Таким образом, у нас есть алгоритм, который может освоить игру в шахматы за 4 часа.
Теперь мы знаем!
Хорошо. Взглянем на сами алгоритмы:
10 лучших алгоритмов машинного обучения
Теперь, прежде чем мы начнем, давайте взглянем на одну из основных концепций машинного обучения. Регрессия , когда дело доходит до алгоритмов регрессии машинного обучения , означает, что алгоритм пытается установить связь между двумя переменными.
Существует много типов регрессии - линейная, логистическая, полиномиальная, обычная регрессия методом наименьших квадратов и т. Д. Сегодня мы рассмотрим только первые 2 типа, потому что в противном случае это будет лучше опубликовано в виде книги, а не статьи.
Как мы увидим через мгновение, большинство из 10 лучших алгоритмов являются алгоритмами контролируемого обучения и лучше всего используются с Python.
Вот список 10 лучших алгоритмов машинного обучения :
1. Линейная регрессия
Это один из самых популярных алгоритмов машинного обучения. Он работает, чтобы установить связь между двумя переменными, подбирая линейное уравнение через наблюдаемые данные.
Другими словами, этот тип алгоритмов учитывает различные особенности, чтобы прийти к заключению. Если количество переменных больше двух - алгоритм будет называться множественной линейной регрессией.
Линейная регрессия также является одним из контролируемых алгоритмов машинного обучения, которые хорошо работают в Python . Это мощный статистический инструмент, который можно применять для прогнозирования поведения потребителей, оценки прогнозов и оценки тенденций. Компания может извлечь выгоду из проведения линейного анализа и прогнозирования продаж на будущий период времени.

Итак, если у нас есть две переменные, одна из них объясняющая , а другая - зависимая . Зависимая переменная представляет собой значение, которое вы хотите исследовать или сделать прогноз. Объясняющая переменная независима. Зависимая переменная всегда рассчитывает на объяснение.
Смысл линейного машинного обучения состоит в том, чтобы увидеть, существует ли значимая связь между двумя переменными, и, если есть, увидеть, что именно она представляет.
Линейная регрессия считается простым алгоритмом машинного обучения и поэтому пользуется популярностью среди ученых.
Теперь есть линейная регрессия и логистическая регрессия. Давайте посмотрим на разницу:
2. Логистическая регрессия
Это один из основных алгоритмов машинного обучения . Это биномиальный классификатор, который имеет только 2 состояния или 2 значения, которым вы можете присвоить значения « Входные данные сжимаются, а затем анализируются.
В отличие от линейной регрессии, логистические алгоритмы делают прогнозы с помощью нелинейной функции. Алгоритмы логистической регрессии используются для классификации, а не для задач регрессии. «Регрессия» в названии предполагает, что алгоритмы используют линейную модель и включают ее в будущее пространство.
Логистическая регрессия - это контролируемый алгоритм машинного обучения, который, как и линейная регрессия, хорошо работает в Python. С математической точки зрения, если ожидается, что выходные данные исследования будут относиться к больному / здоровому или раку / отсутствию рака, то логистическая регрессия является идеальным алгоритмом для использования.
В отличие от линейной регрессии, где выходные данные могут иметь разные значения, логистическая регрессия может иметь на выходе только 1 и 0.
Существует 3 типа логистической регрессии, основанной на категориальном ответе. Эти:
- Бинарная логистическая регрессия - это наиболее часто используемый тип, если на выходе получается несколько вариантов «да» / «нет».
- Многозначная логистическая регрессия - когда есть возможность получить 3 или более ответов без упорядочивания.
- Порядковая логистическая регрессия - снова 3 или более ответа, но с упорядочением. Например, когда ожидаемые результаты оцениваются по шкале от 1 до 10.
Давайте посмотрим на еще один отличный алгоритм классификации:
3. Линейный дискриминантный анализ.
Этот метод находит линейные комбинации функций, которые разделяют разные входные данные. Цель алгоритма LDA - изучить надежную переменную как линейное объединение функций. Это отличный метод классификации .
Этот алгоритм проверяет статистические качества входных данных и производит вычисления для каждого класса. Он измеряет ценность класса, а затем дисперсию между всеми классами.
В процессе моделирования различий между классами алгоритм проверяет входные данные в соответствии с независимыми переменными.
Выходные данные содержат информацию о классе с наивысшим значением. Алгоритмы линейного дискриминантного анализа лучше всего подходят для разделения известных категорий . Когда несколько факторов необходимо математически разделить на категории, мы используем алгоритм LDA.
4. K-ближайшие соседи
Алгоритм kNN - один из лучших алгоритмов машинного обучения для начинающих . Они делают прогнозы на основе старых доступных данных, чтобы классифицировать данные по категориям на основе различных характеристик.
Он находится в списке алгоритмов контролируемого машинного обучения, который в основном используется для классификации. Он хранит доступные данные и использует их для измерения сходства в новых случаях.
К в Knn представляет собой параметр , который обозначает число ближайших соседей , которые будут включены в «мажоритарном процессе голосования». Таким образом, соседи каждого элемента «голосуют», чтобы определить его класс.
Один из лучших способов использования алгоритма kNN - это когда у вас есть небольшой набор данных без шума и все данные помечены. Алгоритм не быстрый и не учится распознавать нечистые данные. Когда набор данных больше, использовать kNN не рекомендуется.
Алгоритм kNN работает так: сначала задается параметр K, после чего алгоритм составляет список записей, близкий к новой выборке данных. Затем он находит наиболее распространенную классификацию записей и, наконец, дает классификацию для новых вводимых данных.
Что касается реальных приложений, алгоритмы kNN используются поисковыми системами, чтобы установить, соответствуют ли результаты поиска запросу. Они невоспетые герои, которые экономят время пользователей при поиске.
Далее идет трио деревьев : деревья регрессии , случайный лес и AdaBoost .
Вот так:
5. Деревья регрессии (также известные как деревья решений)
Да, они называются деревьями , но, поскольку мы говорим об алгоритмах машинного обучения, представьте их с корнями вверху и ветвями и листьями внизу.
Деревья регрессии - это тип алгоритма контролируемого обучения, который, как ни странно, хорошо работает в Python. (Кстати, большинство алгоритмов машинного обучения работают.)
Эти «деревья» также называются деревьями решений и используются для прогнозного моделирования . Они требуют от пользователя относительно небольших усилий с точки зрения количества вводимых данных.
Их представление - двоичное дерево, и они решают задачи классификации. Как следует из названия, этот тип алгоритма использует древовидную модель решений. Они выполняют скрининг переменных или выбор функций. Входные данные могут быть как числовыми, так и категориальными.
Перевод, пожалуйста!
Конечно. Каждый раз, когда вы принимаете решение, вы переходите в новую ситуацию - с новыми решениями, которые нужно принять. Каждый из возможных маршрутов - это «ветвь», а сами решения - «узлы». Ваша первоначальная отправная точка - это основной узел.
Вот как алгоритм дерева решений создает серию узлов и листьев. Здесь важно то, что все они поступают из одного узла. (Напротив, алгоритмы случайного леса создают несколько деревьев, каждое со своим первичным узлом.)
С точки зрения реального применения, деревья регрессии могут использоваться для прогнозирования выживаемости, страховых взносов и цен на недвижимость на основе различных факторов.
Деревья регрессии «вырастают» ветви решений до тех пор, пока не будет достигнут критерий остановки. Он лучше работает с небольшими объемами входных данных, потому что в противном случае вы можете получить смещенный набор выходных данных.
Алгоритм решает, где разделить и сформировать новую ветвь решения, на основе нескольких алгоритмов. Данные разделены на области подзамечаний, которые собираются вокруг всех доступных переменных.
6. Случайный лес
Алгоритм случайного леса является другой формой контролируемого машинного обучения. Он создает несколько деревьев решений вместо одного, как деревья регрессии. Узлы распределены случайным образом, и их порядок не имеет значения для выходных данных. Чем больше будет деревьев, тем точнее будет результат.
Этот тип алгоритма может использоваться как для классификации, так и для регрессии. Одна из замечательных особенностей алгоритма случайного леса заключается в том, что он может работать, когда большая часть данных отсутствует . Он также может работать с большим набором данных.
В случае регрессии эти алгоритмы не лучший выбор, потому что они не имеют большого контроля над тем, что делает модель.
Алгоритмы случайного леса могут быть очень полезны в электронной коммерции. Если вам нужно определить, понравится ли вашим клиентам конкретная пара обуви, вам нужно только собрать информацию об их предыдущих покупках.
Вы указываете тип обуви, был ли у нее каблук или нет, пол покупателя и ценовой диапазон предыдущих пар, которые они заказывали. Это будут ваши входные данные.
Алгоритм сгенерирует достаточно деревьев, чтобы дать вам точную оценку.
Добро пожаловать!
И вот последний алгоритм древовидной системы:
7. AdaBoost
AdaBoost - это сокращение от Adaptive Boosting. Алгоритм был удостоен премии Гёделя в 2003 году для своих создателей.
Как и в предыдущих двух, здесь также используется система деревьев. Только вместо нескольких узлов и листьев деревья в AdaBoost производят только 1 узел и 2 листа, иначе говоря, пень .
Алгоритмы AdaBoost существенно отличаются от деревьев решений и случайных лесов .
Давайте посмотрим:
Алгоритм дерева решения будет использовать много переменных , прежде чем она вырабатывает выходной сигнал. Пень может использовать только 1 переменные , чтобы принять решение.
В случае алгоритмов случайного леса все деревья одинаково важны для окончательного решения. Алгоритмы AdaBoost ставят одни пни выше других.
И последнее, но не менее важное: случайные лесные деревья , так сказать, более хаотичны . Это означает, что последовательность деревьев не имеет значения. Результат не зависит от порядка выращивания деревьев. Напротив, для алгоритмов AdaBoost порядок важен.
Результат каждого дерева является основой для следующего. Таким образом, если в процессе будет ошибка, это повлияет на каждое последующее дерево.
Хорошо, а что этот алгоритм может делать в реальной жизни?
Алгоритмы AdaBoost уже блестят в сфере здравоохранения, где исследователи используют их для измерения рисков заболеваний. У вас есть данные, но разные факторы имеют разную значимость. (Представьте, что вы упали на руку, и ваши врачи используют алгоритм, чтобы определить, сломана она или нет. Если входные данные содержат и рентгеновский снимок вашей руки, и фотографию сломанного ногтя ... ну, совершенно очевидно, какая культя будет уделено большее внимание.)
Итак, мы, так сказать, вышли из леса, поэтому давайте взглянем на 3 других типа алгоритмов машинного обучения:
8. Наивный байесовский
Это удобно, когда у вас есть проблема с классификацией текста . Это алгоритм машинного обучения, используемый, когда нужно иметь дело с многомерными наборами данных, такими как фильтрация спама или классификация новостных статей.
Алгоритм носит это имя сигнатуры, потому что он считает каждую переменную независимой. Другими словами, он считает, что различные характеристики входных данных совершенно не связаны. Это делает его простым и эффективным вероятностным классификатором.
«Байесовская» часть имени относится к человеку, который изобрел теорему, использованную для алгоритма, а именно - Томасу Байесу. Его теорема, как вы могли догадаться, исследует условную вероятность событий.
Вероятности рассчитываются на двух уровнях. Во-первых, вероятность каждого класса. Во-вторых, условная вероятность по данному фактору.
9. Изучение векторного квантования
Алгоритм векторного квантования обучения, или LVQ, является одним из наиболее продвинутых алгоритмов машинного обучения .
В отличие от kNN, алгоритм LVQ представляет собой алгоритм искусственной нейронной сети . Другими словами, он призван воссоздать неврологию человеческого мозга.
Алгоритм LVQ использует набор векторов кодовой книги в качестве представления. По сути, это списки чисел, которые имеют те же входные и выходные качества, что и ваши тренировочные данные.
10. Машины опорных векторов
Это один из самых популярных алгоритмов машинного обучения .
Алгоритм машин опорных векторов подходит для крайних случаев классификаций . Значение - когда граница решения входных данных неясна. SVM служит границей, которая лучше всего разделяет входные классы.
SVM можно использовать в многомерных наборах данных. Алгоритм преобразует нелинейное пространство в линейное пространство. В двух измерениях вы можете визуализировать переменные в виде линии и, таким образом, легче определять корреляции.
SVM уже использовались в различных областях реальной жизни:
- В задачах медицинской визуализации и медицинской классификации
- Изучение качества воздуха в густонаселенных районах.
- Помочь с финансовым анализом
- В алгоритмах ранжирования страниц для поисковых систем
- Для распознавания текста и объектов.
Звучит как швейцарский нож алгоритмов машинного обучения, не так ли?
Заворачивать
Люди и компьютеры могут успешно работать вместе.
Исследователи уверяют, что это партнерство может, и дадут удивительные результаты. Алгоритмы машинного обучения уже во многих отношениях помогают человечеству.
Одна из важнейших функций машинного обучения и алгоритмов искусственного интеллекта - классификация.
Давайте еще раз вкратце рассмотрим 10 лучших алгоритмов машинного обучения:
- Линейная регрессия - используется для установления связи между 2 -х переменным - Логистическая регрессия - биномиальный классификатор, есть только 2 возможных результата каждого запроса.
- Линейный дискриминантный анализ - лучше всего подходит для классификации данных по известным категориям.
- K-Nearest Neighbor - классифицирует данные по категориям.
- Деревья регрессии - используются для прогнозного моделирования.
- Случайный лес - используется с большими наборами данных и когда отсутствует большая часть входных данных.
- AdaBoost - бинарные классификации.
- Наивный Байес - прогнозное моделирование.
- Изучение векторного квантования - алгоритм искусственной нейронной сети.
- Машины опорных векторов - крайние случаи классификации в многомерном наборе данных.
Все эти алгоритмы (плюс новые, которые еще не появились) заложат основу для новой эпохи процветания человечества. Это сделает возможным (и даже необходимым) универсальный базовый доход для обеспечения выживания менее способных людей. (Кто иначе возмутился бы и испортил наше общество. Ну что ж.)
Что ж, кто бы мог подумать, что статья об алгоритмах машинного обучения будет такой глупой. Что ж, на сегодня все.
До скорой встречи, ребята!
часто задаваемые вопросы
Машинное обучение - это круто, и оно проливает свет на будущее технологий. Это требует определенных затрат. Например, компьютеры, на которых размещены программы машинного обучения, потребляют безумное количество электроэнергии и ресурсов. Еще одним недостатком машинного обучения до сих пор было случайное устранение неоднозначности. Иногда машины не могут отличить, скажем, имя Энн Хэтэуэй от стоимости акций Berkshire Hathaway. Каждый раз, когда актриса привлекает внимание СМИ, компания зарабатывает деньги…
Машинное обучение - это метод вычислений. В то время как «традиционным» алгоритмам нужен программист для их написания, алгоритмы машинного обучения в основном обучаются сами. Да без шуток!
Это зависит от задачи, которую вам нужно выполнить. Выбор лучшего алгоритма для решения поставленной задачи зависит от размера, качества и разнообразия ваших входных данных, а также от типа выходных данных, которые запрашивает пользователь.
Как и все остальное, процесс начинается с знакомства с основами алгоритма, который вы выбрали для своей проблемы. Вам нужно будет ознакомиться с различными учебными источниками и выбрать тот, который лучше всего подходит для вас. Затем начните с разбивки алгоритма на небольшие части. Начните с простого примера, и когда вы овладеете ситуацией, вы подтвердите надежность с помощью надежной реализации. А затем вы завершите весь процесс. Возможно, это звучит сложнее, чем есть на самом деле. Но попробовать стоит!