Алгоритмы машинного обучения часто делят на 3 самые популярные категории. Все они относятся к контролируемому, неконтролируемому и усиленному типу машинного обучения.
Контролируемое машинное обучение (обучение с учителем )
Контролируемое обучение создает модель, которая делает прогнозы на основе фактических данных. Для разработки этих прогностических моделей используются методы регрессии и классификации.
- Линейная регрессия: Линейная регрессия выражает линейную зависимость между входом и выходом.
- Полиномиальная регрессия: выражает полиномиальную регрессию между входом и выходом. Это дает более точный результат по сравнению с линейной регрессией.
- Дерево принятия решений (также может называться деревом классификации или регрессионным деревом) — средство поддержки принятия решений, использующееся в машинном обучении, анализе данных и статистике. Структура дерева представляет собой «листья» и «ветки». На рёбрах («ветках») дерева решения записаны атрибуты, от которых зависит целевая функция, в «листьях» записаны значения целевой функции, а в остальных узлах — атрибуты, по которым различаются случаи. Чтобы классифицировать новый случай, надо спуститься по дереву до листа и выдать соответствующее значение. Подобные деревья решений широко используются в интеллектуальном анализе данных. Цель состоит в том, чтобы создать модель, которая предсказывает значение целевой переменной на основе нескольких переменных на входе. ?
- Случайные леса (Random forest): случайные леса используют много деревьев решений. Они являются ансамблем деревьев решений. Каждое дерево решений создается с использованием подмножества атрибутов. Случайный лес - эффективный контролируемый алгоритм классификации.
Неуправляемое машинное обучение (обучение без учителя)
Обучение без учителя обнаруживает закономерности в данных, делая выводы из немаркированных входных данных.
- Кластеризация: группировка объектов в кластеры. Алгоритм кластеризации является k-means, который идентифицирует лучшие k-кластерные центры в итерационной форме.
- Уменьшение размерности: разложение по сингулярным числам (SVD) - это метод разложения матрицы для сведения матрицы к ее составным частям. Основным используемым алгоритмом является Принцип анализа компонентов (PCA).
- Анализ ассоциации: помогает извлечь наиболее часто встречающиеся и самые большие наборы элементов в больших наборах данных. Он используется для обнаружения связей между переменными в больших базах данных.
Усиленное обучения (обучение с подкреплением)
Алгоритмы, включенные в этот тип машинного обучения, используют программные агенты для выполнения действий в среде, чтобы максимизировать значения совокупного вознаграждения. Обычно он включает в себя следующие алгоритмы:
- Критерий оптимальности.
- Функция состояния состояния.
- Методы Монте-Карло.
- Методы временной разницы.
- Прямой поиск
Инженеры машинного обучения настоятельно рекомендуют иметь опыт в вышеупомянутых технологиях, инструментах и алгоритмах, чтобы преуспеть в своей роли.
0 комментариев
Добавить комментарий