Извлечение внутренних знаний для агентов ИИ: когда RAG действительно помогает
RAG полезен, когда он дает агенту доступ к знаниям, которые важны в текущем рабочем процессе. Разочаровывает, когда оно превращается в расплывчатое окно поиска по беспорядочным документам.
Разница в дизайне.
Начните с рабочего процесса, а не с базы данных векторов
Прежде чем приступить к поиску, спросите, что пытается сделать человек или агент.
Примеры:
- ответить на вопрос службы поддержки
- проверить политику
- сравнить запрос с правилом
- понять решение по продукту
- найти предыдущий инцидент
- подготовить контекст для онбординга
Поиск должен служить этой задаче, а не существовать, потому что RAG звучит современно.
Выбирайте ценные источники
Не каждый документ следует индексировать в первую очередь.
Начните с источников, которые:
- часто используемый
- достаточно актуальный
- доверенный
- достаточно структурирован, чтобы его можно было цитировать
- подключен к повторяющимся рабочим процессам
Хорошие кандидаты:
- Часто задаваемые вопросы
- документация по продукту
- записи решений
- известные проблемы
- поддержка макросов
- ранбуки
- журналы изменений
Плохие кандидаты:
- устаревшие документы
- противоречивые записи
- приватные чаты с неясным владельцем
- контент, которому никто не доверяет
Цитирование не является обязательным
Для бизнес-процессов при поиске должны быть показаны источники.
Полезный ответ включает в себя:
- название источника
- раздел или страница
- актуальная цитата
- свидание, если свежесть имеет значение
- уверенность или ограничение
Это делает агента объяснимым.
Разрешения имеют значение
Внутренние знания не все равны. Некоторая информация является конфиденциальной, устаревшей или зависит от роли.
Агент по поиску должен уважать:
- роль пользователя
- разрешения на документы
- границы клиента
- правила конфиденциальных данных
- требования к аудиту
Без разрешений извлечение может привести к утечке данных.
RAG лучше всего работает с контекстом процесса
Общий запрос типа «Какова политика?» слабее, чем поиск внутри процесса:
- текущий клиент
- текущий продукт
- категория проблемы
- регион
- тип контракта
- предыдущие решения
Контекст делает поиск точным.
Практический тест
Спросите:
Поможет ли этот результат поиска компетентному человеку быстрее принять решение?
Если да, то это относится к рабочему процессу. Если нет, то, вероятно, это просто поиск с дополнительными шагами.