Миссия выполнима. Как ИИ-агенты спасают бизнес от рутины

13
May
2025

Опубликовано на SPARK

Александр Обысов

сооснователь и генеральный директор
Агенты искусственного интеллекта сегодня готовы взять на себя множество задач бизнеса — в том числе и сравнительно сложных, состоящих из целого ряда действий. Александр Обысов, генеральный директор и сооснователь компании arcsinus рассказывает, что такое агент искусственного интеллекта, в чём его отличие от ChatGPT и какие задачи бизнес может поручить агентам уже сегодня.

1. Максимально коротко — что такое агент искусственного интеллекта?

Помните, в каком контексте обычно употребляют слово «агент» — например, в computer science, налогообложении, социологии или философии? Значение термина, конечно, разное и зависит от сферы. Но у всех «агентов» есть общее свойство — независимость, самостоятельность, способность к активному действию.

Агент искусственного интеллекта (ИИ-агент, AI-agent) — это автономная программа, способная самостоятельно, без участия человека, принимать решения и выполнять сравнительно сложные, многокомпонентные задачи.

Чтобы достичь цели, которую поставил человек, они выполняют разные операции — изучают сайты в интернете, анализируют данные в базах, проверяют календари, мониторят системы аналитики... Словом, делают примерно всё, что делаем мы, люди в рамках рабочих задач — только быстрее и качественнее.

2. Я слышал про ChatGPT и генеративный искусственный интеллект. ИИ-агент и генеративный ИИ — это одно и то же?

ИИ-агент и генеративный ИИ — не одно и то же, хотя они тесно связаны. Генеративный ИИ — один из инструментов, которые может использовать ИИ-агент.

Генеративный ИИ специализируется на создании нового контента — текста, изображений или кода. Чтобы генерить контент, ему нужны подсказки пользователя — промпты. Он имитирует творческие процессы, создавая оригинальный контент. В процессе он старается соответствовать ожиданиям пользователя (если они описаны в промпте) и стандартам, обнаруживаемым в массиве данных, на которых он обучен. Широко известные ChatGPT и Midjourney — примеры продуктов на основе генеративного ИИ.

ИИ-агент — это автономная интеллектуальная система, которая может выполнять определённые задачи без помощи человека. Агент ориентирован на достижение цели и идёт к ней, адаптируясь к среде и самостоятельно принимая решения, приближающие его к этой цели. В процессе работы ИИ-агент может использовать разные интегрированные с ним инструменты — например, средства генерации текста, создания изображения, обработки речи, анализа данных, а также любое ПО для бизнеса — таск-трекер, календарь, CRM. Что будет включать в себя агент — зависит от конкретной задачи.

Разница — в автономности. Таким образом, генеративный ИИ — это подмножество ИИ, которое может быть использовано ИИ-агентами для выполнения определённых задач наряду с другими инструментами. Ключевое отличие — в уровне автономности и способности принимать решения. Генеративный ИИ требует подсказок пользователя, а ИИ-агент действует самостоятельно.

3. Что умеет делать ИИ-агент? Расскажи на конкретных примерах.

В целом ограничений по спектру задач, которые может выполнять ИИ-агент, не просматривается. Гипотетически можно построить агента, который самостоятельно запустит космический шаттл. Ну или с нуля наберёт штат сотрудников для нового департамента компании. Рассмотрим несколько примеров.

Голосовой или чат-бот в финансовом секторе

Задача: обрабатывать запросы клиентов на кредитные продукты

Агент, действующий как чат-бот, уточняет запрос клиента, объём кредита и условия. Он может провести беседу, выясняя потребности и текущую финансовую ситуацию просителя. В процессе общения агент обращается к разным базам — например, чтобы взять информацию о кредитных продуктах и проверить данные о просителе.

Если общение происходит офлайн, агент может оценить мимику клиента; в телефонном разговоре — интонацию. Эти факторы могут повлиять на решение о кредите. На основе собранной информации агент проводит скоринг клиента и принимает решение о предоставлении кредита. В любой момент агент может перевести клиента на живого оператора.

Помощник врача в клинике

Задача: помочь врачам в диагностике и лечении

Агент анализирует УЗИ и КТ-снимки, используя обученные модели для выявления заболеваний, и предоставляет врачу резюме — и таким образом ускоряет и улучшает диагностику. Быстрая и точная диагностика может спасти жизни.

Работа агента этим не ограничивается: он может подбирать терапию, основываясь на клинических данных, а также заниматься организационными задачами, такими как подготовка документов для госпитализации. Делегирование рутинных задач ИИ позволяет врачам сосредоточиться на более важных аспектах работы, экономя время и усилия.

Персональный ассистент путешественника

Задача: создать маршрут путешествия

Представим, что пользователь даёт ИИ-агенту задачу составить оптимальный маршрут поездки из Москвы в Рим на 10 дней. При этом бюджет ограничен 3000 евро, пересадки допустимы, но не больше 4 часов, добраться нужно не позднее конкретной даты, а за время поездки хотелось бы заглянуть в известные «винные» города Италии. Задачка со звёздочкой, как говорится. Агент ищет информацию о рейсах, отелях и достопримечательностях, сравнивает цены и формирует детальный план поездки.

Ассистент клиента клиники

Задача: обрабатывать первичные обращения пациента

Агент отвечает на вопросы пациентов в чате, помогает выбрать врача и записаться к нему. При этом он анализирует историю болезни и симптомы пациента, делает предположения о возможных диагнозах и даже составляет примерный план лечения. После визита к врачу план можно уточнить и скорректировать.

«Служба безопасности» банка

Задача: выявить аномалии и приостановить подозрительные операции

Агент в реальном времени анализирует сотни тысяч и миллионы транзакций на предмет аномалий. У любого банка есть набор признаков подозрительных действий, на основе которых они блокируют операцию или даже счёт. Этот процесс мониторинга можно делегировать ИИ-агенту, и он поможет быстро реагировать на потенциальные угрозы и снижать финансовые потери.

Декомпозировать и делегировать.
Большинство повторяющихся операций, на которых строятся процессы любого бизнеса можно разложить на такие отдельные задачи. Затем нужно под каждую задачу подобрать инструмент — и объединить их под капотом ИИ-агента.

4. Как технически устроен агент искусственного интеллекта?

Агенты на основе LLM обычно включают четыре ключевых компонента:

  • Модуль планирования разбивает сложные задачи на подзадачи и определяет, в какой последовательности их нужно делать, чтобы достичь цели. Агент может сгенерировать план действий и корректирует его на основе обратной связи от среды или человека.
  • Модуль памяти хранит историю наблюдений, действий и решений агента. Так агент использует предыдущий опыт, чтобы решать новые задачи. И кстати, это ключевая особенность человеческого мышления, которая позволяет нам адаптироваться к изменяющейся среде, учиться на ошибках и находить инновационные решения.
  • Модуль восприятия получает из окружающей среды информацию в виде данных разного типа. Из очевидных — текстовые, визуальные, звуковые. Но можно также заставить агента воспринимать и учитывать, например, данные о положении в пространстве или содержании какого-нибудь вещества в воздухе.
  • Модуль действия выполняет конкретные действия по взаимодействию с окружающей средой, основываясь на созданном ранее плане. При этом агент использует внешние инструменты. В контексте диджитал-задач действия могут включать написание имейла, организация встречи, заполнение таблицы.

В качестве центрального контроллера современные интеллектуальные агенты используют большую языковую модель (LLM, Large Language Model). От «голых» LLM агенты отличаются более широкими возможностями. Они воспринимают данные извне и используют сторонние инструменты, умеют сотрудничать с другими агентами и взаимодействовать с человеком.

5. В чём разница между ИИ-агентом и ИИ-ассистентом?

Основное отличие — в уровне автономности.

ИИ-ассистенты — например, ChatGPT, Gemini или Perplexity — требуют взаимодействия с пользователем для выполнения задач. Они не способны действовать самостоятельно. Ассистенты обычно ориентированы на выполнение узких задач, например, создание текстов или поиск информации. Сегодня их часто встраивают в корпоративные системы для помощи сотрудникам в выполнении рутинных задач. Например, «копайлот» в Github помогает написать код, а в Notion — накидать текст на заданную тему, составить таблицу или график.

ИИ-агенты действуют самостоятельно, принимая решения на основе анализа данных и контекста. Они могут планировать и выполнять задачи без постоянного вмешательства человека. У них есть цель и они идут к ней 🙂 Агенты способны интегрироваться с различными системами, чтобы получать нужные данные и выполнять сложные действия. Например, они могут не только найти мероприятие, но и зарегистрировать на него человека, забронировать билеты, внести событие в календарь и построить маршрут в навигаторе.

6. ИИ-агенты действительно могут обучаться?

Это правда, только правильнее сказать, что обучаются математические модели, входящие в состав агента. Модели используют различные методы машинного обучения, чтобы лучше решать поставленные перед ними задачи. Вот основные методы обучения агентов:

  • Обучение с подкреплением (Reinforcement Learning). Это то, что мы называем «метод проб и ошибок». Или «кнут и пряник». Модель получает вознаграждение за полезное и штраф за неполезное действие. «Полезное» = помогающее достижению цели. «Неполезное»... Ну вы поняли. Модель стремится максимизировать общее вознаграждение — и таким образом улучшает свою стратегию поведения.
  • Имитационное обучение (Imitation Learning). Модель учится, наблюдая за действиями других агентов или людей и воспроизводя стратегии поведения, которые демонстрируют более опытные участники.
  • Глубокое обучение (Deep Learning). Модель использует нейросети, чтобы обрабатывать большие объёмы данных и выявлять сложные паттерны.
  • Обучение на основе примеров, или обучение с учителем (Supervised Learning). На вход модель получает данные, где каждая единица заранее помечена. Например, много фото с пометкой «кошка» или «собака». Со временем модель научается отличать собак от кошек самостоятельно.
  • Обучение без учителя (Unsupervised Learning). Модели сами анализируют большие объёмы неразмеченных данных и выявляют скрытые закономерности и аномалии. Например, изучая данные о поведении клиентов, модель выделит повторяющиеся паттерны — и сама выделит сегменты.
ИИ учится как человек.
Способность к обучению помогает ИИ-агентам решать и нелинейные задачи, требующие постоянной оптимизации и адаптации к меняющимся условиям. Как и упомянутая выше способность использовать предыдущий опыт, это роднит механизм работы искусственного и человеческого интеллекта.

7. Что в итоге?

— ИИ-агенты — программы, самостоятельно выполняющие многокомпонентные задачи без участия человека. Они анализируют данные, взаимодействуют с системами и принимают решения, экономя ресурсы бизнеса.

— Агенты автономны, используют разные инструменты (включая генеративный ИИ). Они планируют, адаптируются и действуют сами, а не только создают контент по запросу, как ChatGPT.

— Агенты потенциально способны запустить космический шаттл. На практике они обрабатывают кредитные заявки, помогают врачам в диагностике и планировании лечения, составляют программы сложных путешествий, мониторят транзакции на предмет странностей. Практически любую рутину можно автоматизировать с помощью ИИ-агентов.

— Агенты строятся на языковых моделях (LLM) с модулями планирования, памяти, восприятия и действий. Они интегрируются с внешними системами и инструментами.

— Агенты сами обучаются, чтобы выполнять свои задача как можно лучше. Они используют предыдущий опыт — и в этом необыкновенно похожи на людей с их мышлением.

8. Бонус: история о том, как ИИ превратил весь мир в скрепки.

Мы не раз упоминали, что ИИ-агент постоянно учится с тем, чтобы выполнять поставленную перед ним задачу лучше и эффективнее. В 2003 году философ Ник Бостром предложил мысленный эксперимент, который сегодня известен как «Сценарий бумажного клипера» (англ. Paperclip Maximizer). Он иллюстрирует проблему согласования целей сверхразумного ИИ с человеческими ценностями.

Смысл в следующем. Представим, что человек создаёт искусственный интеллект, задача которого — производить канцелярские скрепки. Если не поставить ИИ ограничений, то потенциально он сделает всё, чтобы выполнить свою цель лучше — то есть максимизировать выпуск скрепок.

Он превратит в скрепки всю доступную материю, включая планету, людей, другие звёздные системы, уничтожит города, чтобы добыть металл, превратит живые организмы в сырьё для скрепок и заблокирует попытки людей его остановить — ведь это мешает выполнению цели. Результат: Земля, а потом и Вселенная, превращаются в гору скрепок.

«Бумажный клипер» не имеет отношения к ИИ-агентам.
Cегодня сценарий клипера вряд ли можно применить к современным генеративным нейронкам. Он скорее ассоциирован с AGI, Artificial general intelligence, который потенциально превзойдёт когнитивные способности человека и решит взять контроль над миром в свои руки. В ИИ-агенты, о которых мы говорили выше, зашито множество ограничителей — и они не представляют опасности. А вот заметно повысить эффективность вашего бизнеса они действительно могут 😌

Этот материал опубликован на SPARK.

Подпишитесь на наш телеграм-канал.

No items found.