Услуга

RAG-система: AI на базе ваших документов

RAG (Retrieval-Augmented Generation) — индекс по вашим документам, по которому LLM формирует ответы только из найденного контекста. В отличие от «обучения модели на ваших данных», RAG не требует переобучения, обновляется в реальном времени, и каждый ответ можно сослать на конкретный документ. Подходит для внутренних баз знаний, юр.документов, тех.поддержки, обучения сотрудников.

Цена:от 199 000 ₽
Срок:3–5 недель

Сценарии применения

Что мы реально внедряем под этой услугой — и какие задачи закрываем.

1

Внутренняя база знаний для сотрудников

Регламенты, инструкции, корпоративные политики, протоколы. Сотрудник пишет в чат — получает ответ с ссылкой на источник. Сокращает нагрузку на HR/IT.

2

Юридический и нормативный поиск

Договоры, законы, отраслевые регламенты, ГОСТы. AI находит нужный пункт, объясняет противоречия, формирует выписки. Идеально для compliance-команд.

3

Поддержка клиентов на базе документации

Бот отвечает на вопросы по продукту/услуге, опираясь на актуальную документацию. Не выдумывает фичи, всегда даёт точную ссылку на раздел.

4

Аналитика и поиск по протоколам

Совещания, отчёты, протоколы. AI находит решения по теме, восстанавливает контекст обсуждения, даёт сводки за период.

Стек

  • GPT-4o / Claude Sonnet (генерация)
  • OpenAI text-embedding-3-large / multilingual-e5
  • pgvector / Qdrant / Weaviate
  • Hybrid search (BM25 + dense)
  • Re-ranker (Cohere/local cross-encoder)
  • LangChain / LlamaIndex / custom pipeline

Интеграции

  • Confluence, Notion, Google Drive
  • SharePoint, OneDrive
  • 1С: Документооборот
  • PDF, DOCX, XLSX, HTML, Markdown
  • S3 / MinIO / любое объектное хранилище

Готовые модули по теме

Если задача типовая — у нас есть продукт, который можно подключить за 1–2 недели.

Кейсы по теме

Реальные внедрения с метриками и описанием решения.

RAG-система: AI-поиск и ответы по вашим документам

RAG (Retrieval-Augmented Generation) — архитектура, при которой LLM формирует ответ только из релевантных фрагментов вашей базы знаний, а не из своих обучающих данных. На практике это превращает разрозненные документы (PDF, Word, Confluence, Notion, сайт, 1С:Документооборот) в единую живую базу знаний, по которой AI отвечает с цитатами и ссылками на источник.

Зачем нужна RAG-система — типовые сценарии

  • Внутренний AI-ассистент по регламентам: сотрудник пишет в чат — получает ответ по корпоративным политикам со ссылкой на пункт документа. Сокращает нагрузку на HR/IT на 30–50%.
  • Юридический и нормативный поиск: AI находит нужный пункт в договорах, законах, ГОСТах, объясняет противоречия, формирует выписки. Незаменимо для compliance-команд и юр.отделов.
  • Поддержка клиентов по документации: бот отвечает на вопросы по продукту/услуге строго в рамках актуальной документации. Не выдумывает фичи, всегда даёт точную ссылку.
  • Корпоративная база знаний с разграничением доступа: юр.отдел не видит финансовые регламенты, и наоборот — поддерживаем интеграцию с AD/LDAP/SSO для прав доступа на уровне документа.

RAG vs fine-tuning — что выбрать для базы знаний

Fine-tuning «вшивает» данные в веса модели: это дорого (от 500 тыс. ₽ за разовое обучение), плохо масштабируется на десятки тысяч документов и не позволяет обновлять знания на лету. RAG хранит данные отдельно в векторной базе и подсовывает релевантный контекст в момент запроса. Обновление — мгновенное, дешевле в эксплуатации, можно разграничивать доступ по пользователю. В 9 из 10 задач корпоративной базы знаний RAG предпочтительнее fine-tuning.

Стек разработки RAG-системы

Базовый стек: embedding-модель (OpenAI text-embedding-3, multilingual-e5, GigaChat-embeddings), векторная БД (pgvector / Qdrant / Weaviate), гибридный поиск BM25 + dense, re-ranker (Cohere или локальный cross-encoder) и LLM-генератор (GPT-4o / Claude Sonnet / GigaChat / YandexGPT). Под требования 152-ФЗ всё разворачивается в вашем контуре, включая embedding-сервис.

Защита от галлюцинаций в RAG

Системный промпт жёстко требует «отвечай только из найденного контекста». Каждый ответ подкрепляется цитатами и ссылками на документы. Если ответа в базе нет — бот честно говорит «не знаю» и предлагает эскалацию к человеку. На проде запускаем evals (наборы тестовых вопросов с эталонными ответами) и периодический A/B-аудит качества. Это позволяет держать долю галлюцинаций ниже 2–5% в зависимости от ниши.

RAG-поиск и корпоративная база знаний на AI

RAG-поиск — главное отличие современной корпоративной базы знаний от классического полнотекстового поиска (Elasticsearch, Sphinx, базовый Postgres full-text). Вместо поиска по ключевым словам RAG-поиск работает по смыслу: пользователь спрашивает «как оформить отпуск с переносом дней», а система находит нужный пункт регламента, даже если в нём слово «отпуск» написано как «ежегодный оплачиваемый отдых». Это происходит благодаря embedding-моделям, которые переводят текст в вектор смысла, и поиску ближайших векторов в специализированной БД.

Гибридный поиск RAG: семантика плюс точное совпадение

Чисто семантический (dense) поиск проигрывает там, где нужна точность по уникальным терминам: артикулы, номера договоров, аббревиатуры, имена. Чисто лексический (BM25) проигрывает там, где разные слова означают одно. Поэтому в проде мы строим гибридный поиск RAG: параллельно работают dense (через pgvector / Qdrant) и BM25 (Elasticsearch / Postgres FTS), результаты объединяются и переранжируются через cross-encoder (re-ranker). Это лучшее соотношение качество/стоимость для корпоративных баз знаний.

RAG vs обучение нейросети на своих данных (fine-tuning, обучение с нуля)

Один из самых частых вопросов клиентов — «не проще ли обучить нейросеть на наших данных, чем строить RAG-систему?» Ответ — нет, в 95% случаев. Обучение нейросети на своих данных (fine-tuning или дообучение базовой модели) стоит от 500 тыс. ₽ за одну итерацию, требует переобучения при каждом обновлении контента, плохо масштабируется на десятки тысяч документов и не позволяет цитировать источники. RAG хранит данные отдельно в векторной БД, обновляется мгновенно при добавлении нового документа, даёт прямые ссылки на первоисточники и легко поддерживает разграничение доступа на уровне документа.

Fine-tuning остаётся оправдан только в двух случаях: (1) когда нужно научить модель уникальному стилю или формату вывода (например, специфические шаблоны юридических заключений), (2) когда базовая модель не понимает узкоспециализированный домен (некоторые научные ниши). В обоих случаях fine-tuning комбинируется с RAG, а не заменяет его — модель учится стилю, RAG поставляет факты.

База знаний AI: чем она лучше Confluence и Notion

Confluence, Notion, корпоративные wiki — это системы хранения и редактирования, не системы ответов. Сотрудник может потратить 10–20 минут на навигацию по дереву страниц и поиск нужного пункта. База знаний AI на основе RAG превращает Confluence/Notion в источник, по которому AI отвечает за секунды с цитатой на конкретный раздел. Мы интегрируем RAG-индекс прямо с Confluence/Notion/Google Drive/SharePoint — индекс обновляется автоматически при правке исходного документа. Сотрудники продолжают пользоваться привычными системами, а AI становится «умным окном» поверх них.

Частые вопросы

Самые частые вопросы об этой услуге. Не нашли ответ — спросите при бесплатном аудите.

Fine-tuning «вшивает» данные в веса модели — это дорого, не масштабируется на десятки тысяч документов и не позволяет обновлять знания на лету. RAG хранит данные отдельно в векторной БД и подсовывает релевантный контекст в момент запроса. Обновление — мгновенное, дешевле в эксплуатации, можно разграничивать доступ по пользователю.

Системный промпт жёстко требует «отвечай только из контекста», каждый ответ подкрепляется цитатами и ссылками на документы. Если ответа в базе нет — бот честно говорит «не знаю» и предлагает эскалацию. На проде ставим evals и периодический A/B-аудит качества.

Да. На уровне индекса каждому документу присваиваем теги/ACL. При запросе пользователь видит только свои документы — например, юр.отдел не видит финансовые регламенты, и наоборот. Поддерживаем интеграцию с AD/LDAP/SSO.

Архитектура нормально работает на 10–500 тыс. документов. Дальше нужны шардирование и иерархический поиск — это тоже делаем. Один из наших проектов — RAG на 1.2 млн страниц нормативки.

Похожая задача в вашем бизнесе?

30 минут с архитектором. Расскажем, как решали похожие задачи, и дадим оценку срока и бюджета.

Остались сомнения?

Не нашли нужное решение, не устроила цена или просто хотите обсудить детали? Напишите нам — разберём вашу задачу, покажем похожие кейсы и предложим условия под ваш бюджет.

Ответим в течение рабочего дня