Безопасность LLM-интеграции¶

Руководство по защите данных при работе с поставщиками LLM

Содержание¶

Обзор
Гарантии безопасности
Архитектура
Конвейер обработки запроса
Принципы защиты данных
1. Исходный код не передаётся
API Reference
SecureLLMProvider
Методы
Контекстные параметры
Конфигурация
Полная конфигурация (config.yaml)
Обработка ошибок
DLPBlockedException
Структура ошибки
Управление секретами
Интеграция с HashiCorp Vault
Резервное переключение на переменные окружения
Аудит и логирование
Структура лога запроса
SIEM события
Потоковая генерация
Особенности потокового режима
Метрики и мониторинг
Prometheus метрики
Grafana Dashboard
Лучшие практики
Для разработчиков
Для операторов
Для обеспечения соответствия
Связанные документы

Обзор¶

Модуль SecureLLMProvider обеспечивает комплексную защиту при работе с внешними поставщиками LLM (GigaChat, Yandex AI, OpenAI и др.). Модуль реализует принцип “defence in depth” — многоуровневую защиту данных.

Гарантии безопасности¶

Гарантия	Реализация
Код не передаётся	Только NL-запросы отправляются в LLM
Pre-request DLP	Сканирование до отправки
Post-response DLP	Маскирование в ответах
Полный аудит	Логирование каждого запроса
SIEM интеграция	События в реальном времени
Секреты в Vault	API-ключи в HashiCorp Vault

Архитектура¶

Конвейер обработки запроса¶

┌─────────────────────────────────────────────────────────────────────────┐
│                         SecureLLMProvider                               │
│                                                                         │
│  ┌─────────────────────────────────────────────────────────────────┐   │
│  │                     1. PRE-REQUEST PHASE                         │   │
│  │                                                                  │   │
│  │  User Query ──► [DLP Scanner] ──┬──► BLOCK ──► DLPBlockedException │
│  │                                 │                                │   │
│  │                                 ├──► MASK ──► Masked Query       │   │
│  │                                 │                                │   │
│  │                                 └──► PASS ──► Original Query     │   │
│  │                                                    │              │   │
│  │                                    ┌───────────────┘              │   │
│  │                                    ▼                              │   │
│  │                             [SIEM Event]                         │   │
│  └─────────────────────────────────────────────────────────────────┘   │
│                                       │                                 │
│                                       ▼                                 │
│  ┌─────────────────────────────────────────────────────────────────┐   │
│  │                    2. LLM PROVIDER CALL                          │   │
│  │                                                                  │   │
│  │  [VaultClient] ──► API Key ──► [GigaChat/Yandex AI/OpenAI] ──► Response │
│  │                                                                  │   │
│  │  • API ключ из Vault                                            │   │
│  │  • TLS соединение                                               │   │
│  │  • Request ID tracking                                          │   │
│  └─────────────────────────────────────────────────────────────────┘   │
│                                       │                                 │
│                                       ▼                                 │
│  ┌─────────────────────────────────────────────────────────────────┐   │
│  │                   3. POST-RESPONSE PHASE                         │   │
│  │                                                                  │   │
│  │  Response ──► [DLP Scanner] ──► Mask Sensitive Data ──► User    │   │
│  │                     │                                            │   │
│  │                     ▼                                            │   │
│  │              [SIEM Event]                                        │   │
│  └─────────────────────────────────────────────────────────────────┘   │
│                                       │                                 │
│                                       ▼                                 │
│  ┌─────────────────────────────────────────────────────────────────┐   │
│  │                     4. AUDIT LOGGING                             │   │
│  │                                                                  │   │
│  │  • Request ID                  • Token usage                     │   │
│  │  • User ID                     • Latency                         │   │
│  │  • Session ID                  • DLP matches                     │   │
│  │  • IP address                  • Error details                   │   │
│  │                                                                  │   │
│  │  ──► [PostgreSQL] + [SIEM]                                      │   │
│  └─────────────────────────────────────────────────────────────────┘   │
└─────────────────────────────────────────────────────────────────────────┘

Принципы защиты данных¶

1. Исходный код не передаётся¶

┌──────────────────────────────────────────────────────────────────┐
│                      ПЕРИМЕТР ОРГАНИЗАЦИИ                         │
│                                                                  │
│   [Source Code] ──► [CPG Analysis] ──► [DuckDB]                 │
│                                           │                      │
│                                           ▼                      │
│   [User] ──► "Find buffer overflow in function X"               │
│                           │                                      │
│                           ▼                                      │
│                   [RAG Query Engine]                            │
│                           │                                      │
│                           ▼                                      │
│               NL Query (no code snippets)                       │
│                           │                                      │
└───────────────────────────┼──────────────────────────────────────┘
                            │
                            ▼
                  [GigaChat/Yandex API]
                            │
                            ▼
               NL Response (explanation)

Что передаётся LLM: - Текстовые запросы пользователей - Метаданные (имена функций, файлов) - Структурированные данные из CPG

Что НЕ передаётся: - Исходный код - Содержимое файлов - Строки подключения - Секреты и учётные данные

Справочник API¶

SecureLLMProvider¶

from src.security.llm import SecureLLMProvider
from src.security.config import get_security_config
from src.llm.gigachat import GigaChatProvider

# Создание защищённого поставщика
base_provider = GigaChatProvider(config)
secure_provider = SecureLLMProvider(
    wrapped_provider=base_provider,
    config=get_security_config()
)

# Использование (с контекстом безопасности)
response = secure_provider.generate(
    system_prompt="You are a security analyst.",
    user_prompt="Analyze this function for vulnerabilities.",
    _user_id="analyst@company.com",
    _session_id="sess-12345",
    _ip_address="10.0.0.50"
)

Методы¶

Метод	Описание
`generate(system_prompt, user_prompt, **kwargs)`	Генерация с полной защитой
`generate_simple(prompt, **kwargs)`	Упрощённый вызов
`generate_stream(system_prompt, user_prompt, **kwargs)`	Потоковая генерация
`is_available()`	Проверка доступности поставщика

Контекстные параметры¶

Параметр	Описание
`_user_id`	ID пользователя для аудита
`_session_id`	ID сессии
`_ip_address`	IP-адрес клиента

Конфигурация¶

Полная конфигурация (config.yaml)¶

security:
  enabled: true

  # Логирование LLM-взаимодействий
  llm_logging:
    enabled: true
    log_prompts: true           # Логировать промпты
    redact_prompts: true        # Редактировать чувствительные данные
    max_prompt_length: 2000     # Макс. длина в логе
    log_responses: true         # Логировать ответы
    max_response_length: 5000   # Макс. длина ответа в логе
    log_token_usage: true       # Логировать использование токенов
    log_latency: true           # Логировать задержку
    log_to_database: true       # Сохранять в PostgreSQL
    log_to_siem: true           # Отправлять в SIEM

  # DLP конфигурация
  dlp:
    enabled: true
    pre_request:
      enabled: true
      default_action: WARN
    post_response:
      enabled: true
      default_action: MASK

  # SIEM интеграция
  siem:
    enabled: true
    syslog:
      enabled: true
      host: "siem.company.com"
      port: 514

  # HashiCorp Vault
  vault:
    enabled: true
    url: "https://vault.company.com:8200"
    auth_method: "approle"
    llm_secrets_path: "codegraph/llm"

Обработка ошибок¶

DLPBlockedException¶

from src.security.dlp import DLPBlockedException

try:
    response = secure_provider.generate(
        system_prompt="...",
        user_prompt=user_input
    )
except DLPBlockedException as e:
    # Запрос заблокирован DLP
    logger.warning(f"DLP blocked: {e.message}")

    # Информация о нарушениях
    for match in e.matches:
        print(f"Category: {match.category}")
        print(f"Pattern: {match.pattern_name}")
        print(f"Severity: {match.severity}")

    # Вернуть ошибку клиенту
    return {
        "error": "dlp_blocked",
        "message": "Request contains sensitive data",
        "categories": e.to_dict()["categories"]
    }

Структура ошибки¶

{
  "error": "dlp_blocked",
  "message": "Request blocked by DLP policy. Detected 2 violation(s) in categories: credentials, pii. Please remove sensitive data before retrying.",
  "categories": ["credentials", "pii"],
  "violation_count": 2
}

Управление секретами¶

Интеграция с HashiCorp Vault¶

from src.security.vault import VaultClient
from src.security.config import get_security_config

config = get_security_config()
vault = VaultClient(config.vault)

# Получение учётных данных LLM
credentials = vault.get_llm_credentials()

# Результат:
# {
#   "gigachat_credentials": "...",
#   "yandex_ai_api_key": "...",
#   "yandex_ai_folder_id": "...",
#   "openai_api_key": "sk-...",
#   "anthropic_api_key": "sk-ant-..."
# }

Резервное переключение на переменные окружения¶

При недоступности Vault используются переменные окружения:

Переменная	Поставщик
`GIGACHAT_CREDENTIALS`	GigaChat
`YANDEX_AI_API_KEY`	Yandex AI Studio
`YANDEX_AI_FOLDER_ID`	Yandex Cloud Folder
`OPENAI_API_KEY`	OpenAI

Аудит и логирование¶

Структура лога запроса¶

{
  "timestamp": "2026-02-26T10:30:00.000Z",
  "request_id": "req-12345",
  "event": "llm_request",
  "provider": "GigaChatProvider",
  "model": "GigaChat-2-Pro",
  "user_id": "analyst@company.com",
  "session_id": "sess-67890",
  "ip_address": "10.0.0.50",
  "latency_ms": 1250.5,
  "tokens": {
    "prompt_tokens": 150,
    "completion_tokens": 450,
    "total_tokens": 600
  },
  "dlp": {
    "pre_request_matches": 0,
    "post_response_matches": 1,
    "action": "MASK"
  }
}

SIEM события¶

Событие	Когда отправляется
`LLM_REQUEST`	При отправке запроса
`LLM_RESPONSE`	При получении ответа
`LLM_ERROR`	При ошибке
`DLP_BLOCK`	При блокировке DLP
`DLP_MASK`	При маскировании

Потоковая генерация¶

Особенности потокового режима¶

# Потоковая генерация с защитой
for chunk in secure_provider.generate_stream(
    system_prompt="You are a security analyst.",
    user_prompt="Explain this vulnerability.",
    _user_id="analyst@company.com"
):
    # Chunk уже прошёл pre-request DLP
    print(chunk, end="", flush=True)

# Post-response DLP выполняется после завершения потока
# Если обнаружены чувствительные данные - событие в SIEM

Ограничения streaming: - Pre-request DLP работает полностью - Post-response DLP логирует совпадения, но не может модифицировать уже отправленные chunks - Рекомендуется для интерактивных сценариев с низким риском

Метрики и мониторинг¶

Prometheus метрики¶

# Количество LLM-запросов
rate(llm_requests_total[5m])

# Количество DLP-блокировок
rate(dlp_blocks_total{phase="llm_request"}[5m])

# Средняя задержка LLM
histogram_quantile(0.95, rate(llm_latency_seconds_bucket[5m]))

# Использование токенов
sum(rate(llm_tokens_total[1h])) by (provider, model)

# Ошибки LLM
rate(llm_errors_total[5m])

Grafana Dashboard¶

{
  "panels": [
    {
      "title": "LLM Requests per Minute",
      "query": "rate(llm_requests_total[1m])"
    },
    {
      "title": "DLP Block Rate",
      "query": "rate(dlp_blocks_total{phase='llm_request'}[5m]) / rate(llm_requests_total[5m])"
    },
    {
      "title": "P95 Latency",
      "query": "histogram_quantile(0.95, rate(llm_latency_seconds_bucket[5m]))"
    },
    {
      "title": "Token Usage by Model",
      "query": "sum(rate(llm_tokens_total[1h])) by (model)"
    }
  ]
}

Лучшие практики¶

Для разработчиков¶

Всегда передавайте контекст — _user_id, _session_id, _ip_address
Обрабатывайте DLPBlockedException — информируйте пользователя
Используйте потоковый режим осторожно — понимайте ограничения после DLP
Не логируйте ответы целиком — используйте max_response_length

Для операторов¶

Мониторьте DLP block rate — высокий показатель может указывать на проблему
Настройте алерты на LLM_ERROR — ошибки поставщика требуют внимания
Ротируйте API-ключи — используйте Vault с auto-rotation
Аудит токенов — отслеживайте аномальное потребление

Для обеспечения соответствия¶

Документируйте потоки данных — какие данные и куда передаются
Храните логи — минимум 1 год для обеспечения соответствия
Регулярный аудит — проверяйте эффективность DLP
Incident response — план реагирования на DLP_BLOCK

Примечание: Структурированные шаблоны промптов управляются через глобальный реестр промптов (config/prompts/), что обеспечивает централизованный аудит и версионирование всех LLM-промптов, используемых платформой.

Связанные документы¶

Enterprise Security Brief — Обзор безопасности
DLP Security — DLP-шаблоны и конфигурация
SIEM Integration — Интеграция с SIEM

Версия: 1.1 | Февраль 2026