Технологии машинного обучения позволяют принимать решения практически во всех отраслях - от здравоохранения до управления персоналом и финансов, а также в огромном количестве вариантов использования, таких как компьютерное зрение, большие языковые модели (LLM), распознавание речи, самоуправляемые автомобили и многое другое.
Однако растущее влияние машинного обучения не обходится без сложностей. Наборы данных для проверки и обучения, которые лежат в основе технологии машинного обучения, часто собираются людьми, а люди подвержены предвзятости и склонны к ошибкам. Даже в тех случаях, когда модель машинного обучения сама по себе не является предвзятой или ошибочной, ее применение в неправильном контексте может привести к ошибкам с непредвиденными вредными последствиями.
Именно поэтому диверсификация использования ИИ и машинного обучения в корпоративном секторе может оказать неоценимую помощь в сохранении конкурентных преимуществ. Каждый тип и подтип алгоритма машинного обучения обладает уникальными преимуществами и возможностями, которые команды могут использовать для решения различных задач. Здесь мы рассмотрим пять основных типов и области их применения.
Что такое машинное обучение? Машинное обучение - это раздел информатики, науки о данных и искусственного интеллекта (ИИ), который позволяет системам обучаться и совершенствоваться на основе данных без дополнительного программирования.
Вместо того чтобы использовать явные инструкции для оптимизации производительности, модели машинного обучения опираются на алгоритмы и статистические модели, которые решают задачи на основе шаблонов данных и умозаключений. Другими словами, машинное обучение использует входные данные для прогнозирования результатов, постоянно обновляя их по мере поступления новых данных.
Например, на веб-сайтах розничной торговли алгоритмы машинного обучения влияют на решения потребителей о покупке, давая рекомендации на основе истории покупок. Платформы электронной коммерции многих розничных компаний, в том числе IBM, Amazon, Google, Meta и Netflix, используют искусственные нейронные сети (ИНС) для предоставления персонализированных рекомендаций. Кроме того, ритейлеры часто используют данные от чат-ботов и виртуальных помощников в сочетании с технологиями машинного обучения и обработки естественного языка (NLP) для автоматизации процесса совершения покупок.
Типы машинного обучения Алгоритмы машинного обучения делятся на пять широких категорий: контролируемое обучение, неконтролируемое обучение, полуконтролируемое обучение, самоконтролируемое обучение и обучение с подкреплением.
1. Контролируемое машинное обучение Контролируемое машинное обучение - это тип машинного обучения, при котором модель обучается на наборе данных с метками (т. е. целевая или итоговая переменная известна). Например, если ученые, изучающие данные, строят модель для прогнозирования торнадо, входными переменными могут быть дата, местоположение, температура, характер ветра и т. д., а выходными - фактическая активность торнадо, зарегистрированная в эти дни.
Контролируемое обучение обычно используется для оценки рисков, распознавания образов, предиктивной аналитики и выявления мошенничества и включает в себя несколько типов алгоритмов.
- Регрессионные алгоритмы - прогнозирование выходных значений путем выявления линейной зависимости между реальными или непрерывными величинами (например, температурой, зарплатой). К регрессионным алгоритмам относятся линейная регрессия, случайный лес, градиентный бустинг и другие подтипы.
- Алгоритмы классификации - прогнозирование категориальных выходных переменных (например, "хлам" или "не хлам") путем маркировки фрагментов входных данных. Алгоритмы классификации включают логистическую регрессию, k-nearest neighbors и машины опорных векторов (SVM), среди прочих.
- Классификаторы Наива Байеса - позволяют решать задачи классификации для больших наборов данных. Они также относятся к семейству алгоритмов генеративного обучения, которые моделируют распределение входных данных для данного класса или/категории. Алгоритмы Наива Байеса включают деревья решений, которые на самом деле могут включать в себя как регрессию, так и алгоритмы классификации.
- Нейронные сети - имитируют работу человеческого мозга с огромным количеством связанных между собой узлов обработки, которые могут облегчить такие процессы, как перевод естественного языка, распознавание изображений, речи и создание образов.
- Алгоритмы случайного леса - предсказывают значение или категорию, объединяя результаты нескольких деревьев решений.
2. Неконтролируемое машинное обучение Неподконтрольные алгоритмы обучения - Apriori, модели гауссовых смесей (GMM) и анализ главных компонент (PCA) - делают выводы из немаркированных наборов данных, облегчая исследовательский анализ данных, позволяя распознавать шаблоны и проводить прогнозное моделирование.
Наиболее распространенным методом обучения без контроля является кластерный анализ, который использует алгоритмы кластеризации для классификации точек данных в соответствии со сходством значений (как в сегментации клиентов или обнаружении аномалий). Алгоритмы ассоциаций позволяют специалистам по исследованию данных выявлять ассоциации между объектами данных в больших базах данных, облегчая визуализацию данных и уменьшая их размерность.
Кластеризация K-средних - распределение точек данных по K группам, где точки данных, наиболее близкие к заданному центроиду, объединяются в одну категорию, а K представляет кластеры в зависимости от их размера и уровня детализации. Кластеризация K-средних обычно используется для сегментации рынка, кластеризации документов, сегментации изображений и сжатия изображений.
Иерархическая кластеризация - описывает набор методов кластеризации, включая агломеративную кластеризацию, при которой точки данных первоначально выделяются в группы, а затем итеративно объединяются на основе сходства, пока не останется один кластер, и делительную кластеризацию, при которой один кластер данных делится на основе различий между точками данных.
Вероятностная кластеризация - помогает решить проблемы оценки плотности или "мягкой" кластеризации путем группировки точек данных на основе вероятности их принадлежности к определенному распределению.
Неподконтрольные модели ML часто стоят за рекомендательными системами типа "клиенты, купившие это, также купили...".
3. Самоконтролируемое машинное обучение Самоконтролируемое обучение (SSL) позволяет моделям самообучаться на немеченых данных, не требуя огромных аннотированных и/или меченых наборов данных. Алгоритмы SSL, также называемые алгоритмами предиктивного или предтекстового обучения, обучают одну часть входных данных на основе другой части, автоматически генерируя метки и преобразуя неконтролируемые задачи в контролируемые. Эти алгоритмы особенно полезны в таких областях, как компьютерное зрение и NLP, где объем помеченных обучающих данных, необходимых для обучения моделей, может быть исключительно большим (иногда запредельно большим).
4. Обучение с подкреплением Обучение с подкреплением, также называемое обучением с подкреплением на основе человеческой обратной связи (RLHF), - это тип динамического программирования, который обучает алгоритмы с помощью системы поощрения и наказания. Для применения обучения с подкреплением агент выполняет действия в определенной среде для достижения заранее определенной цели. Агент получает вознаграждение или наказание за свои действия на основе установленной метрики (обычно это баллы), поощряя агента продолжать хорошие действия и отказываться от плохих. При повторении агент учится лучшим стратегиям.
Алгоритмы обучения с подкреплением широко распространены в разработке видеоигр и часто используются для обучения роботов повторению человеческих задач.
5. Полуподконтрольное обучение Пятый тип машинного обучения представляет собой комбинацию между полунаблюдаемым и ненаблюдаемым обучением.
Алгоритмы полунаблюдаемого обучения обучаются на небольшом наборе меченых данных и большом наборе немеченых данных, при этом меченые данные направляют процесс обучения для большего объема немеченых данных. Модель полунаблюдаемого обучения может использовать ненаблюдаемое обучение для определения кластеров данных, а затем использовать контролируемое обучение для маркировки кластеров.
Генеративные состязательные сети (GAN) - инструмент глубокого обучения, который генерирует немаркированные данные путем обучения двух нейронных сетей - являются примером полусупервизорного машинного обучения.
Независимо от типа, модели машинного обучения могут извлекать информацию из корпоративных данных, но их уязвимость перед предвзятостью человека и данных делает ответственную практику ИИ обязательной для организации.