Опубликовано на SPARK
Агенты искусственного интеллекта сегодня готовы взять на себя множество задач бизнеса — в том числе и сравнительно сложных, состоящих из целого ряда действий. Александр Обысов, генеральный директор и сооснователь компании arcsinus рассказывает, что такое агент искусственного интеллекта, в чём его отличие от ChatGPT и какие задачи бизнес может поручить агентам уже сегодня.
Помните, в каком контексте обычно употребляют слово «агент» — например, в computer science, налогообложении, социологии или философии? Значение термина, конечно, разное и зависит от сферы. Но у всех «агентов» есть общее свойство — независимость, самостоятельность, способность к активному действию.
Агент искусственного интеллекта (ИИ-агент, AI-agent) — это автономная программа, способная самостоятельно, без участия человека, принимать решения и выполнять сравнительно сложные, многокомпонентные задачи.
Чтобы достичь цели, которую поставил человек, они выполняют разные операции — изучают сайты в интернете, анализируют данные в базах, проверяют календари, мониторят системы аналитики... Словом, делают примерно всё, что делаем мы, люди в рамках рабочих задач — только быстрее и качественнее.
ИИ-агент и генеративный ИИ — не одно и то же, хотя они тесно связаны. Генеративный ИИ — один из инструментов, которые может использовать ИИ-агент.
Генеративный ИИ специализируется на создании нового контента — текста, изображений или кода. Чтобы генерить контент, ему нужны подсказки пользователя — промпты. Он имитирует творческие процессы, создавая оригинальный контент. В процессе он старается соответствовать ожиданиям пользователя (если они описаны в промпте) и стандартам, обнаруживаемым в массиве данных, на которых он обучен. Широко известные ChatGPT и Midjourney — примеры продуктов на основе генеративного ИИ.
ИИ-агент — это автономная интеллектуальная система, которая может выполнять определённые задачи без помощи человека. Агент ориентирован на достижение цели и идёт к ней, адаптируясь к среде и самостоятельно принимая решения, приближающие его к этой цели. В процессе работы ИИ-агент может использовать разные интегрированные с ним инструменты — например, средства генерации текста, создания изображения, обработки речи, анализа данных, а также любое ПО для бизнеса — таск-трекер, календарь, CRM. Что будет включать в себя агент — зависит от конкретной задачи.
Разница — в автономности. Таким образом, генеративный ИИ — это подмножество ИИ, которое может быть использовано ИИ-агентами для выполнения определённых задач наряду с другими инструментами. Ключевое отличие — в уровне автономности и способности принимать решения. Генеративный ИИ требует подсказок пользователя, а ИИ-агент действует самостоятельно.
В целом ограничений по спектру задач, которые может выполнять ИИ-агент, не просматривается. Гипотетически можно построить агента, который самостоятельно запустит космический шаттл. Ну или с нуля наберёт штат сотрудников для нового департамента компании. Рассмотрим несколько примеров.
Задача: обрабатывать запросы клиентов на кредитные продукты
Агент, действующий как чат-бот, уточняет запрос клиента, объём кредита и условия. Он может провести беседу, выясняя потребности и текущую финансовую ситуацию просителя. В процессе общения агент обращается к разным базам — например, чтобы взять информацию о кредитных продуктах и проверить данные о просителе.
Если общение происходит офлайн, агент может оценить мимику клиента; в телефонном разговоре — интонацию. Эти факторы могут повлиять на решение о кредите. На основе собранной информации агент проводит скоринг клиента и принимает решение о предоставлении кредита. В любой момент агент может перевести клиента на живого оператора.
Задача: помочь врачам в диагностике и лечении
Агент анализирует УЗИ и КТ-снимки, используя обученные модели для выявления заболеваний, и предоставляет врачу резюме — и таким образом ускоряет и улучшает диагностику. Быстрая и точная диагностика может спасти жизни.
Работа агента этим не ограничивается: он может подбирать терапию, основываясь на клинических данных, а также заниматься организационными задачами, такими как подготовка документов для госпитализации. Делегирование рутинных задач ИИ позволяет врачам сосредоточиться на более важных аспектах работы, экономя время и усилия.
Задача: создать маршрут путешествия
Представим, что пользователь даёт ИИ-агенту задачу составить оптимальный маршрут поездки из Москвы в Рим на 10 дней. При этом бюджет ограничен 3000 евро, пересадки допустимы, но не больше 4 часов, добраться нужно не позднее конкретной даты, а за время поездки хотелось бы заглянуть в известные «винные» города Италии. Задачка со звёздочкой, как говорится. Агент ищет информацию о рейсах, отелях и достопримечательностях, сравнивает цены и формирует детальный план поездки.
Задача: обрабатывать первичные обращения пациента
Агент отвечает на вопросы пациентов в чате, помогает выбрать врача и записаться к нему. При этом он анализирует историю болезни и симптомы пациента, делает предположения о возможных диагнозах и даже составляет примерный план лечения. После визита к врачу план можно уточнить и скорректировать.
Задача: выявить аномалии и приостановить подозрительные операции
Агент в реальном времени анализирует сотни тысяч и миллионы транзакций на предмет аномалий. У любого банка есть набор признаков подозрительных действий, на основе которых они блокируют операцию или даже счёт. Этот процесс мониторинга можно делегировать ИИ-агенту, и он поможет быстро реагировать на потенциальные угрозы и снижать финансовые потери.
Декомпозировать и делегировать.
Большинство повторяющихся операций, на которых строятся процессы любого бизнеса можно разложить на такие отдельные задачи. Затем нужно под каждую задачу подобрать инструмент — и объединить их под капотом ИИ-агента.
Агенты на основе LLM обычно включают четыре ключевых компонента:
В качестве центрального контроллера современные интеллектуальные агенты используют большую языковую модель (LLM, Large Language Model). От «голых» LLM агенты отличаются более широкими возможностями. Они воспринимают данные извне и используют сторонние инструменты, умеют сотрудничать с другими агентами и взаимодействовать с человеком.
Основное отличие — в уровне автономности.
ИИ-ассистенты — например, ChatGPT, Gemini или Perplexity — требуют взаимодействия с пользователем для выполнения задач. Они не способны действовать самостоятельно. Ассистенты обычно ориентированы на выполнение узких задач, например, создание текстов или поиск информации. Сегодня их часто встраивают в корпоративные системы для помощи сотрудникам в выполнении рутинных задач. Например, «копайлот» в Github помогает написать код, а в Notion — накидать текст на заданную тему, составить таблицу или график.
ИИ-агенты действуют самостоятельно, принимая решения на основе анализа данных и контекста. Они могут планировать и выполнять задачи без постоянного вмешательства человека. У них есть цель и они идут к ней 🙂 Агенты способны интегрироваться с различными системами, чтобы получать нужные данные и выполнять сложные действия. Например, они могут не только найти мероприятие, но и зарегистрировать на него человека, забронировать билеты, внести событие в календарь и построить маршрут в навигаторе.
Это правда, только правильнее сказать, что обучаются математические модели, входящие в состав агента. Модели используют различные методы машинного обучения, чтобы лучше решать поставленные перед ними задачи. Вот основные методы обучения агентов:
ИИ учится как человек.
Способность к обучению помогает ИИ-агентам решать и нелинейные задачи, требующие постоянной оптимизации и адаптации к меняющимся условиям. Как и упомянутая выше способность использовать предыдущий опыт, это роднит механизм работы искусственного и человеческого интеллекта.
— ИИ-агенты — программы, самостоятельно выполняющие многокомпонентные задачи без участия человека. Они анализируют данные, взаимодействуют с системами и принимают решения, экономя ресурсы бизнеса.
— Агенты автономны, используют разные инструменты (включая генеративный ИИ). Они планируют, адаптируются и действуют сами, а не только создают контент по запросу, как ChatGPT.
— Агенты потенциально способны запустить космический шаттл. На практике они обрабатывают кредитные заявки, помогают врачам в диагностике и планировании лечения, составляют программы сложных путешествий, мониторят транзакции на предмет странностей. Практически любую рутину можно автоматизировать с помощью ИИ-агентов.
— Агенты строятся на языковых моделях (LLM) с модулями планирования, памяти, восприятия и действий. Они интегрируются с внешними системами и инструментами.
— Агенты сами обучаются, чтобы выполнять свои задача как можно лучше. Они используют предыдущий опыт — и в этом необыкновенно похожи на людей с их мышлением.
Мы не раз упоминали, что ИИ-агент постоянно учится с тем, чтобы выполнять поставленную перед ним задачу лучше и эффективнее. В 2003 году философ Ник Бостром предложил мысленный эксперимент, который сегодня известен как «Сценарий бумажного клипера» (англ. Paperclip Maximizer). Он иллюстрирует проблему согласования целей сверхразумного ИИ с человеческими ценностями.
Смысл в следующем. Представим, что человек создаёт искусственный интеллект, задача которого — производить канцелярские скрепки. Если не поставить ИИ ограничений, то потенциально он сделает всё, чтобы выполнить свою цель лучше — то есть максимизировать выпуск скрепок.
Он превратит в скрепки всю доступную материю, включая планету, людей, другие звёздные системы, уничтожит города, чтобы добыть металл, превратит живые организмы в сырьё для скрепок и заблокирует попытки людей его остановить — ведь это мешает выполнению цели. Результат: Земля, а потом и Вселенная, превращаются в гору скрепок.
«Бумажный клипер» не имеет отношения к ИИ-агентам.
Cегодня сценарий клипера вряд ли можно применить к современным генеративным нейронкам. Он скорее ассоциирован с AGI, Artificial general intelligence, который потенциально превзойдёт когнитивные способности человека и решит взять контроль над миром в свои руки. В ИИ-агенты, о которых мы говорили выше, зашито множество ограничителей — и они не представляют опасности. А вот заметно повысить эффективность вашего бизнеса они действительно могут 😌
Этот материал опубликован на SPARK.
Подпишитесь на наш телеграм-канал.