FORTECH.DEV

menu-icon
telegram-icon

Написать в Telegram

telegram-icon

RAG-системы для корпоративных знаний: как ИИ работает с внутренними документами компании

Мария Балаклеева

Директор по развитию

22.05.2026
7 минут
Бизнес

    Понедельник, 11:00. Менеджер техподдержки копается в корпоративной wiki третий час подряд – ищет регламент обработки жалоб клиентов. Нужная версия документа где-то между 47 PDF в SharePoint, пятью Confluence-страницами и чатом поддержки в Slack за прошлый квартал. Пока он ищет – клиент ждёт. А таких запросов у него 15 в день.

    RAG-системы (Retrieval-Augmented Generation) решают эту проблему иначе: ИИ находит нужные фрагменты в корпоративных документах и формирует ответ на естественном языке. Не поиск по ключевым словам – полноценное понимание контекста. В этом материале разберём, как работает технология, где она экономит время бизнеса и что нужно для внедрения.

    Что такое RAG и почему это важно для бизнеса

    Языковые модели типа GPT знают много, но не знают специфики вашего бизнеса. RAG добавляет к ним внешнюю память – базу корпоративных документов. Когда сотрудник задаёт вопрос, система сначала ищет релевантные фрагменты в вашей базе знаний, затем передаёт их языковой модели – и та формирует ответ на основе реальных данных компании.

    Разница с обычным поиском критическая. Поиск по ключевым словам выдаст 200 документов со словом «регламент». RAG прочитает контекст вопроса, найдёт три релевантных параграфа из разных источников и сформулирует готовый ответ со ссылками на первоисточники. Экономия времени – от 40 минут до 5 минут на типовой запрос.

    25864693.png

    Бизнес-эффект проявляется в трёх зонах: техподдержка отвечает быстрее, юристы не перечитывают сотни договоров вручную, новые сотрудники находят информацию без эскалации к коллегам. В проекте для крупной нефтегазовой компании мы интегрировали CRM ELMA с системой документооборота КИС КЭД, автоматизация обмена данными между системами сократила время поиска нужных документов – сотрудники получают информацию из единой точки, а не переключаются между тремя интерфейсами.

    Архитектура RAG-системы: векторные базы данных и языковые модели

    RAG состоит из трёх компонентов: векторной базы данных, механизма поиска и языковой модели. Векторная база хранит документы не как текст, а как математические представления смысла – эмбеддинги. Когда приходит запрос, система превращает его в вектор и ищет ближайшие по смыслу фрагменты документов.

    Векторные базы – это Pinecone, Weaviate, Qdrant или PostgreSQL с расширением pgvector. Они работают не с точным совпадением слов, а с семантической близостью. Запрос «как оформить отпуск за свой счёт» найдёт параграф про неоплачиваемый отпуск, даже если там нет этой формулировки. Скорость поиска – миллисекунды на базе из миллионов документов.

    Языковая модель получает найденные фрагменты как контекст и генерирует ответ. Можно использовать OpenAI API, Anthropic Claude или open-source модели типа Llama 2 на собственных серверах. Второй вариант критичен для компаний с требованиями к конфиденциальности — данные не покидают периметр. В проекте интеграция корпоративных систем через REST API позволила данным оставаться внутри инфраструктуры заказчика, что соответствует требованиям безопасности нефтегазовой отрасли.

    Промпт – связующее звено. Он говорит модели: «Вот документы, вот вопрос – ответь строго на основе предоставленной информации». Без правильного промпта модель начнёт додумывать.

    Примеры применения: от техподдержки до юридического анализа

    Техподдержка – первая точка применения. Операторы второй линии тратят 30–40% времени на поиск инструкций в базе знаний. RAG-система находит ответ за секунды и предлагает готовую формулировку. Оператор проверяет, корректирует при необходимости и отправляет клиенту. Скорость обработки тикета растёт вдвое.

    Юридический анализ – вторая зона. Юрист получает запрос: «Найди все договоры с условиями отсрочки платежа больше 60 дней за 2023 год». Вручную – день работы. RAG просматривает 500 договоров за минуту, находит 12 релевантных и выдаёт таблицу с выжимкой условий. Юрист проверяет результат и формирует рекомендацию.

    25864696.png

    Адаптация новых сотрудников – третья область. Вместо того чтобы дёргать коллег вопросами «Где найти шаблон ТЗ?» или «Какой регламент согласования бюджета?», новичок спрашивает у RAG-системы. Она отвечает со ссылками на актуальные версии документов. Нагрузка на команду падает, адаптация ускоряется.

    Внутренняя аналитика – четвёртое направление. «Сколько раз клиенты жаловались на медленную доставку в Сибирь за квартал?» RAG анализирует тикеты, письма и чаты, находит паттерны и формирует отчёт. Аналитик получает инсайты без ручной выгрузки данных.

    Пошаговое внедрение RAG в компанию: от подготовки данных до интеграции

    Первый шаг – инвентаризация источников данных. Где лежат документы: SharePoint, Confluence, Google Drive, корпоративный портал, CRM? Сколько форматов: PDF, DOCX, HTML, Markdown? RAG работает со всеми, но нужны коннекторы для выгрузки. Если данные разбросаны по 10 системам без API – подготовка займёт 80% времени проекта.

    Второй шаг – чистка и структурирование. Удалите дубли, устаревшие версии, документы без смысловой нагрузки. Разметьте метаданные: дата создания, автор, категория, уровень конфиденциальности. Метаданные позволят фильтровать результаты: «Ищи только в документах отдела продаж за 2025 год».

    Третий шаг – выбор технологического стека. Векторная база: если данных меньше 100 тысяч документов, хватит pgvector в PostgreSQL. Больше – смотрите на Qdrant или Weaviate. Языковая модель: для чувствительных данных – Llama 2 или GigaChat на своих серверах. Для остального – OpenAI API или Anthropic.

    Четвёртый шаг – пилот на узкой задаче. Возьмите одну проблему: база знаний техподдержки или регламенты HR. Запустите систему для 10 пользователей, соберите обратную связь. Типичные проблемы: модель находит нерелевантные фрагменты, формулировки слишком общие, ответы без ссылок на источники. Это исправляется настройкой промптов и улучшением разметки данных.

    Пятый шаг – интеграция с рабочими инструментами. RAG должен быть там, где работают люди: Slack, MS Teams, корпоративный портал. В проекте для «Лукойла» интеграция ELMA CRM с КИС КЭД через REST API позволила сотрудникам получать документы из единого интерфейса – без переключения между системами. Аналогично с RAG: встройте его в привычный интерфейс, иначе сотрудники не будут пользоваться.

    Безопасность и контроль доступа в RAG-системах

    RAG работает с конфиденциальными данными – значит, права доступа критичны. Если сотрудник отдела продаж не может открыть финансовый отчёт в SharePoint, RAG не должен показывать ему фрагменты из этого отчёта. Система обязана наследовать права доступа из исходных систем.

    Реализация – через метаданные и фильтрацию на уровне векторной базы. Каждому документу присваивается ACL (список контроля доступа): группы и роли, которым разрешён просмотр. Перед поиском система проверяет роль пользователя и ищет только в документах, доступных ему. Если права в исходной системе изменились – синхронизация должна происходить в реальном времени или раз в сутки.

    Логирование запросов обязательно. Кто, когда и что искал, какие документы система выдала. Это нужно для аудита и выявления попыток несанкционированного доступа. Если сотрудник отдела маркетинга внезапно начал искать зарплаты топ-менеджмента – это сигнал для службы безопасности.

    Если используете внешние API (OpenAI, Anthropic) – данные покидают периметр компании. Для регулируемых отраслей (финтех, медицина, госсектор) это неприемлемо. Решение – разворачивать open-source модели на своих серверах или использовать российские облака с сертификацией (GigaChat, YandexGPT). Рынок ИИ в РФ оценивается в 110 млрд руб. – инфраструктура есть.

    Часто задаваемые вопросы

    Сколько стоит внедрение RAG-системы?
    Зависит от объёма данных и выбора стека. Пилот на 50 тысяч документов с использованием OpenAI API и pgvector – от 500 тысяч рублей и 4–6 недель. Полноценное решение на собственной инфраструктуре с open-source моделями – от 3 миллионов и 3–4 месяца разработки.

    Можно ли использовать RAG для документов на русском языке?
    Да. Современные эмбеддинг-модели (например, multilingual-e5 или ruBERT) и языковые модели (GigaChat, YandexGPT, Llama 2 с дообучением) хорошо работают с русским. Качество сопоставимо с английским.

    Как обновлять базу знаний – вручную или автоматически?
    Автоматически, через коннекторы к исходным системам. Новый документ появился в SharePoint – система индексирует его в векторную базу в течение 5–10 минут. Ручное обновление убивает смысл автоматизации.

    Что делать, если RAG выдаёт неточные ответы?
    Проверьте три точки: качество данных (есть ли дубли, устаревшие версии), настройку поиска (правильные ли параметры семантической близости) и промпт для модели (чётко ли вы указали, что отвечать только на основе найденных документов). В 80% случаев проблема в одном из этих мест.

    RAG – не замена людям, а инструмент, который экономит часы поиска информации. Техподдержка отвечает быстрее, юристы не тонут в договорах, новички адаптируются без эскалации. Начните с пилота на узкой задаче – одной проблеме и 10 пользователях. Если система сэкономит 20 часов в неделю, масштабируйте на всю компанию. Технология работает. Проверено.

    25864695.png

    Уже появились идеи?

    или
    Phone
    0/1000 символов
    Политикой конфиденциальности
    ООО «Фортех»
    ИНН / КПП
    6154162274
    /
    616401001
    ОГРН
    1226100005922
    ОКВЭД
    62.01 Разработка компьютерного программного обеспечения
    Код вида деятельности в области IT:1.01, 1.04, 1.05, 1.06
    Аккредитованная IT-компания
    Минцифры России
    VKTelegramMaxYouTubeWorkspace

    Позвать нас в тендер