Руководство по интеграции Yandex AI Studio¶

Руководство по интеграции Yandex Cloud AI Studio с CodeGraph с использованием API, совместимого с OpenAI.

Содержание¶

Обзор
Быстрое начало (3 шага)
Шаг 1: Создание API-ключа
Шаг 2: Настройка переменных окружения
Доступные модели
Модели генерации текста
Модели эмбеддингов
Формат URI модели
Использование в коде
Базовое использование
Потоковая передача
Эмбеддинги
Справочник по настройке
Пример полного config.yaml
Переменные окружения
Параметры поставщика
Конфиденциальность и соответствие требованиям
Обработка ошибок
Ошибка аутентификации (401)
Превышение ограничения на запросы (429)
Время ожидания соединения
Ошибка идентификатора папки
Логика повторных попыток
Рекомендации
Сравнение с другими поставщиками
Ресурсы
Дальнейшие шаги

Обзор¶

Yandex Cloud AI Studio — это комплексная платформа ИИ, предоставляющая доступ к: - Моделям семейства YandexGPT (YandexGPT, YandexGPT-Lite, YandexGPT-32k) - Открытым моделям (Qwen3, DeepSeek, OpenAI OSS) - Моделям эмбеддингов для семантического поиска

CodeGraph интегрируется с Yandex AI Studio через API, совместимый с OpenAI, что позволяет использовать стандартную библиотеку openai на Python.

Основные возможности: - Совместимость с API OpenAI (используйте привычную библиотеку openai) - Фокус на конфиденциальности: логирование отключено по умолчанию через заголовок x-data-logging-enabled: false - Разнообразие моделей с параметрами от 20 млрд до 235 млрд - Встроенная повторная отправка запросов с экспоненциальной задержкой

Быстрая настройка (3 шага)¶

Шаг 1: Создание API-ключа¶

Перейдите в консоль Yandex Cloud
В левом меню выберите AI Studio
Нажмите Создать новый ключ в верхней панели
Выберите Создать API-ключ
В поле Область доступа (Scope) выберите yc.ai.languageModels.execute
Нажмите Создать и сохраните идентификатор (ID) и секретный ключ
Запишите ваш ID папки, который можно найти в селекторе папок в верхней панели

Шаг 2: Установка переменных окружения¶

# Windows PowerShell
$env:YANDEX_API_KEY = "AQVNxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
$env:YANDEX_FOLDER_ID = "b1gxxxxxxxxxxxxxxxxx"

# Постоянная настройка (сохраняется после перезагрузки)
[System.Environment]::SetEnvironmentVariable('YANDEX_API_KEY', 'AQVNxxx...', 'User')
[System.Environment]::SetEnvironmentVariable('YANDEX_FOLDER_ID', 'b1gxxx...', 'User')

# Linux/Mac
export YANDEX_API_KEY="AQVNxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
export YANDEX_FOLDER_ID="b1gxxxxxxxxxxxxxxxxx"

# Добавьте в ~/.bashrc для постоянного эффекта
echo 'export YANDEX_API_KEY="your_key"' >> ~/.bashrc
echo 'export YANDEX_FOLDER_ID="your_folder"' >> ~/.bashrc

Шаг 3: Настройка config.yaml¶

llm:
  provider: yandex

  yandex:
    api_key: ${YANDEX_API_KEY}
    folder_id: ${YANDEX_FOLDER_ID}
    model: "qwen3-235b-a22b-fp8/latest"
    temperature: 0.7
    max_tokens: 2000
    timeout: 180

Проверка конфигурации:

python -c "
from src.llm.yandex_provider import YandexProvider
from src.llm.base_provider import LLMConfig

config = LLMConfig(provider_type='yandex')
provider = YandexProvider(config)
print(f'Поставщик: {provider}')
print('Подключение успешно!')
"

Доступные модели¶

Модели генерации текста¶

Модель	URI	Контекст	Рекомендуется для
Qwen3 235B	qwen3-235b-a22b-fp8/latest	262K	Сложный анализ кода, проверка безопасности (по умолчанию)
gpt-oss-120b	gpt-oss-120b/latest	131K	Модель OpenAI OSS для логических задач, сложные задания
gpt-oss-20b	gpt-oss-20b/latest	131K	Модель OpenAI OSS, сбалансированная производительность
Gemma 3 27B	gemma-3-27b-it/latest	131K	Открытая модель Google, оптимизирована под инструкции
YandexGPT Pro 5	yandexgpt/latest	32K	Универсальное применение, отличная поддержка русского языка
YandexGPT Pro 5.1	yandexgpt/rc	32K	Новейшие функции, улучшенные логические способности
YandexGPT Lite 5	yandexgpt-lite	32K	Быстрые ответы, простые запросы
Alice AI LLM	aliceai-llm	32K	Диалоговые системы, разговорный ИИ
Тонко настроенная YandexGPT Lite	yandexgpt-lite/latest@	32K	Пользовательские тонко настроенные модели

Рекомендации: - Анализ кода: Используйте qwen3-235b-a22b-fp8/latest (контекст 262K, наилучшее качество) - Проверка безопасности: Используйте gpt-oss-120b/latest (возможности логического анализа) - Быстрые запросы: Используйте yandexgpt-lite для скорости - Русский язык: Используйте yandexgpt/latest для родной поддержки русского - Большие файлы: Используйте модели с контекстом 131K и выше (Qwen3, gpt-oss, Gemma)

Модели эмбеддингов¶

Модель	Размерность	Применение
text-search-doc/latest	256	Эмбеддинги документов (по умолчанию)
text-search-query/latest	256	Эмбеддинги запросов

Формат URI модели¶

Yandex требует использования определённого формата URI модели:

gpt://<folder_id>/<model_name>
emb://<folder_id>/<embedding_model>

Примеры:

gpt://b1g123456789/qwen3-235b-a22b-fp8/latest
gpt://b1g123456789/yandexgpt/latest
emb://b1g123456789/text-search-doc/latest

Поставщик CodeGraph автоматически формирует такой URI на основе ваших параметров folder_id и model.

Использование в коде¶

Базовое использование¶

import os
from openai import OpenAI

# Инициализация клиента с использованием конечной точки Yandex
client = OpenAI(
    api_key=os.getenv("YANDEX_API_KEY"),
    base_url="https://llm.api.cloud.yandex.net/v1",
    default_headers={
        "x-data-logging-enabled": "false",  # Приватность
        "x-folder-id": os.getenv("YANDEX_FOLDER_ID"),
    },
)

# Формирование URI модели
folder_id = os.getenv("YANDEX_FOLDER_ID")
model_uri = f"gpt://{folder_id}/qwen3-235b-a22b-fp8/latest"

# Отправка запроса
response = client.chat.completions.create(
    model=model_uri,
    messages=[
        {"role": "system", "content": "Вы — эксперт по анализу кода."},
        {"role": "user", "content": "Объясните, что такое MVCC в PostgreSQL."},
    ],
    temperature=0.7,
    max_tokens=2000,
)

print(response.choices[0].message.content)

Потоковая передача¶

# Потоковая передача ответа
stream = client.chat.completions.create(
    model=model_uri,
    messages=[
        {"role": "user", "content": "Перечислите рекомендации по обеспечению безопасности в C-коде."},
    ],
    stream=True,
)

for chunk in stream:
    if chunk.choices and chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="", flush=True)

Эмбеддинги¶

# Получение эмбеддингов
embedding_uri = f"emb://{folder_id}/text-search-doc/latest"

response = client.embeddings.create(
    model=embedding_uri,
    input="Найти уязвимости переполнения буфера",
    encoding_format="float",
)

embedding = response.data[0].embedding
print(f"Размерность эмбеддинга: {len(embedding)}")  # 256

Использование с рабочим процессом CodeGraph¶

from src.llm.yandex_provider import YandexProvider
from src.llm.base_provider import LLMConfig

# Инициализация поставщика (считывает данные из config.yaml)
config = LLMConfig(
    provider_type='yandex',
    temperature=0.7,
    max_tokens=2000,
    extra_params={
        'api_key': os.getenv('YANDEX_API_KEY'),
        'folder_id': os.getenv('YANDEX_FOLDER_ID'),
        'model': 'qwen3-235b-a22b-fp8/latest',
    }
)
provider = YandexProvider(config)

# Генерация ответа
response = provider.generate(
    system_prompt="Вы — эксперт по безопасности PostgreSQL.",
    user_prompt="Найдите уязвимости SQL-инъекций в модуле исполнителя."
)

print(response.content)
print(f"Использовано токенов: {response.metadata['tokens_used']}")
print(f"Задержка: {response.metadata['latency_ms']:.0f} мс")

Использование в рабочем процессе:

from src.workflow.orchestration.copilot import Copilot

# Copilot автоматически использует настроенный поставщик
copilot = Copilot()
result = copilot.answer("Найдите функции выделения памяти в PostgreSQL")
print(result['answer'])

Справочник по конфигурации¶

Пример полного файла config.yaml¶

llm:
  # Установить Yandex в качестве активного поставщика
  provider: yandex

  yandex:
    # Обязательно: Аутентификация
    api_key: ${YANDEX_API_KEY}      # API-ключ сервисного аккаунта
    folder_id: ${YANDEX_FOLDER_ID}  # Идентификатор каталога Yandex Cloud

    # Выбор модели
    model: "qwen3-235b-a22b-fp8/latest"  # Лучше всего подходит для анализа кода

    # Конечная точка API (по умолчанию, обычно не меняется)
    base_url: "https://llm.api.cloud.yandex.net/v1"

    # Ограничения по времени
    timeout: 180  # секунд (увеличен для больших запросов)

    # Параметры генерации
    temperature: 0.7       # Уровень креативности (0.0–1.0)
    max_tokens: 2000       # Максимальная длина ответа
    top_p: null            # Использовать значение по умолчанию от Yandex

    # Модель эмбеддингов
    embedding_model: "text-search-doc/latest"

Переменные окружения¶

Переменная	Обязательно	Описание
YANDEX_API_KEY	Да	API-ключ из консоли Yandex Cloud
YANDEX_FOLDER_ID	Да	Идентификатор каталога, в котором включён AI Studio

Параметры поставщика¶

Параметр	Тип	По умолчанию	Описание
api_key	строка	-	API-ключ Yandex Cloud (обязательный)
folder_id	строка	-	Идентификатор каталога Yandex Cloud (обязательный)
model	строка	qwen3-235b-a22b-fp8/latest	Модель генерации текста
base_url	строка	https://llm.api.cloud.yandex.net/v1	Конечная точка API
timeout	целое	60	Время ожидания запроса в секундах
temperature	число с плавающей точкой	0.7	Степень случайности ответа (0.0–1.0)
max_tokens	целое	2000	Максимальное количество токенов в ответе
top_p	число с плавающей точкой	null	Параметр выборки ядра (nucleus sampling)
embedding_model	строка	text-search-doc/latest	Модель для эмбеддингов

Конфиденциальность и соответствие требованиям¶

CodeGraph автоматически отключает логирование на стороне Яндекса в целях соблюдения требований конфиденциальности и 152-ФЗ «О персональных данных»:

default_headers={
    "x-data-logging-enabled": "false",  # Отключает логирование на стороне Яндекса
    "x-folder-id": folder_id,
}

Это гарантирует: - Ваши запросы не сохраняются в логах Яндекса - Данные ответов не хранятся - Соответствие требованиям защиты данных

Обработка ошибок¶

Ошибка аутентификации (401)¶

Error: 401 Unauthorized

Решения:

# Проверьте, установлены ли переменные
echo $YANDEX_API_KEY
echo $YANDEX_FOLDER_ID

# Проверьте формат API-ключа (должен начинаться с AQVNw, AQVN_ или аналогичного)
python -c "import os; key = os.getenv('YANDEX_API_KEY', ''); print(f'Префикс ключа: {key[:5]}...' if key else 'НЕ УСТАНОВЛЕН')"

# Убедитесь, что область действия API-ключа включает yc.ai.languageModels.execute

Превышено ограничение по частоте запросов (429)¶

Error: 429 Too Many Requests

Решения:

# Встроенная повторная попытка автоматически обрабатывает эту ситуацию
# Но вы можете увеличить время ожидания для сложных запросов
yandex:
  timeout: 300  # 5 минут

Или реализуйте собственную логику повторных попыток:

import time

for attempt in range(3):
    try:
        response = provider.generate(system_prompt, user_prompt)
        break
    except YandexRateLimitError:
        time.sleep(2 ** attempt)  # Экспоненциальная задержка

Время ожидания соединения¶

Error: Request timeout

Решения:

# Увеличьте время ожидания для больших запросов или ответов
yandex:
  timeout: 300  # секунд

Ошибка идентификатора каталога¶

Error: Folder not found or access denied

Решения: 1. Убедитесь, что идентификатор каталога указан верно (выпадающий список в верхней панели консоли Yandex Cloud) 2. Убедитесь, что AI Studio включён в этом каталоге 3. Проверьте, что у API-ключа есть доступ к данному каталогу

Логика повторных попыток¶

Поставщик Yandex включает встроенную поддержку повторных попыток с экспоненциальной задержкой:

# Автоматические повторные попытки для:
# - APITimeoutError (истекло время ожидания)
# - APIConnectionError (проблемы с подключением)

# Параметры повтора:
# - max_retries: 3
# - initial_delay: 2.0 секунды
# - max_delay: 30.0 секунд
# - backoff_factor: 2.0

Пример последовательности повторных попыток: 1. Первая попытка не удалась -> ожидание 2 с 2. Вторая попытка не удалась -> ожидание 4 с 3. Третья попытка не удалась -> возникновение исключения

Сравнение с другими поставщиками¶

Возможность	Yandex AI Studio	GigaChat	OpenAI
Совместимость с API	Совместимо с OpenAI	Собственный SDK	Родной формат
Лучшая модель	Qwen3 235B	GigaChat-2-Pro	GPT-4
Заголовок конфиденциальности	Да (x-data-logging-enabled)	Нет	Нет
Поддержка русского языка	Отличная	Отличная	Хорошая
Тарифы	Плата за токен	Плата за токен	Плата за токен
Макс. контекст	262K (Qwen3)	32K	128K (GPT-4)
Открытые модели	Qwen3, Gemma, gpt-oss	Нет	Нет

Ресурсы¶

Дальнейшие шаги¶

Установка — Полное руководство по настройке
Конфигурация — Все параметры
Руководство пользователя TUI — Работа с системой
Интеграция GigaChat — Альтернативный поставщик LLM

Руководство по интеграции Yandex AI Studio

Руководство по интеграции Yandex AI Studio¶

Содержание¶

Обзор¶

Быстрая настройка (3 шага)¶

Шаг 1: Создание API-ключа¶

Шаг 2: Установка переменных окружения¶

Шаг 3: Настройка config.yaml¶

Доступные модели¶

Модели генерации текста¶

Модели эмбеддингов¶

Формат URI модели¶

Использование в коде¶

Базовое использование¶

Потоковая передача¶

Эмбеддинги¶

Использование с рабочим процессом CodeGraph¶

Справочник по конфигурации¶

Пример полного файла config.yaml¶

Переменные окружения¶

Параметры поставщика¶

Конфиденциальность и соответствие требованиям¶

Обработка ошибок¶

Ошибка аутентификации (401)¶

Превышено ограничение по частоте запросов (429)¶

Время ожидания соединения¶

Ошибка идентификатора каталога¶

Логика повторных попыток¶

Рекомендации¶

Сравнение с другими поставщиками¶

Ресурсы¶

Дальнейшие шаги¶