Руководство по установке¶

Полная инструкция по установке CodeGraph.

Содержание¶

Системные требования
Аппаратные требования
Программное обеспечение
Шаг 1: Настройка окружения
Шаг 2: Настройка базы данных PostgreSQL
Установка PostgreSQL
Проверка установки PostgreSQL
Настройка пароля базы данных
Шаг 3: Инициализация базы данных
Проверка базы данных
Шаг 4: Создание администратора
Шаг 5: Настройка поставщика LLM (необязательно)
Вариант A: GigaChat (рекомендуется для России)
Вариант B: Локальная LLM (llama-cpp-python)
Вариант C: OpenAI API
Шаг 6: Запуск сервера API
Шаг 7: Проверка установки
Доступ к документации API
Проверка работоспособности (health endpoint)
Проверка аутентификации
Проверка защищённого конечной точки
Шаг 8: Настройка данных CPG
Устранение неполадок
Не удалось подключиться к PostgreSQL
Ошибка аутентификации по паролю
База данных не существует
Порт 8000 уже используется
CUDA не найдена (для локальной LLM)
Нехватка памяти
Дальнейшие шаги

Системные требования¶

Аппаратные требования¶

Процессор: рекомендуется 8 и более ядер
Оперативная память: минимум 16 ГБ (32 ГБ и более для крупных кодовых баз с локальной языковой моделью)
Видеокарта: NVIDIA RTX 3090 или выше (необязательно, для локальной языковой модели)
Место на диске: 50 ГБ свободного места

Программное обеспечение¶

Windows 10/11 или Linux
Python 3.11+
PostgreSQL 15+ (требуется для сервера API; рекомендуется PostgreSQL 17)
DuckDB >= 1.4.2 (требуется для расширения графовых запросов DuckPGQ; устанавливается через requirements.txt)
Git
Go 1.26+ с CGO (необязательно, требуется для сборки GoCPG из исходников)
CUDA Toolkit 11.8+ (необязательно, для ускорения локальной языковой модели с помощью GPU)

Шаг 1: Настройка окружения¶

# Клонировать репозиторий
git clone <адрес-репозитория>
cd codegraph

# Создать окружение conda (рекомендуется)
conda create -n codegraph python=3.11
conda activate codegraph

# ИЛИ создать виртуальное окружение venv
python -m venv venv
source venv/bin/activate  # В Windows: venv\Scripts\activate

# Установить зависимости
pip install -r requirements.txt

Шаг 2: Настройка базы данных PostgreSQL¶

Установка PostgreSQL¶

Windows:

# Скачайте и установите PostgreSQL 17 по адресу:
# https://www.postgresql.org/download/windows/

# Или используйте Chocolatey:
choco install postgresql

Linux:

# Ubuntu/Debian
sudo apt update
sudo apt install postgresql postgresql-contrib

# Fedora/RHEL
sudo dnf install postgresql-server postgresql-contrib
sudo postgresql-setup --initdb
sudo systemctl enable postgresql
sudo systemctl start postgresql

Проверка установки PostgreSQL¶

# Проверьте, запущен ли PostgreSQL
# Windows (PowerShell):
Get-Service postgresql*

# Linux:
sudo systemctl status postgresql

Настройка пароля базы данных¶

Задайте пароль для пользователя postgres:

# Linux:
sudo -u postgres psql -c "ALTER USER postgres PASSWORD 'your_password';"

# Windows:
# Запустите psql от имени пользователя postgres и выполните:
# ALTER USER postgres PASSWORD 'your_password';

Важно: Запомните этот пароль — он понадобится вам для формирования строки DATABASE_URL.

Шаг 3: Инициализация базы данных¶

Установите строку подключения к базе данных в качестве переменной окружения:

# Замените 'your_password' на реальный пароль от PostgreSQL
export DATABASE_URL="postgresql+asyncpg://postgres:your_password@localhost:5432/codegraph"

# Windows PowerShell:
$env:DATABASE_URL="postgresql+asyncpg://postgres:your_password@localhost:5432/codegraph"

Инициализируйте базу данных с помощью CLI проекта:

# Создание базы данных и выполнение миграций
python -m src.api.cli init-db

Эта команда выполнит следующее: 1. Создаст базу данных codegraph 2. Запустит миграции Alembic для создания всех таблиц 3. Инициализирует схему базы данных

Проверка базы данных¶

# Проверьте, что таблицы были созданы
# Windows:
"C:\Program Files\PostgreSQL\17\bin\psql.exe" -U postgres -d codegraph -c "\dt"

# Linux:
psql -U postgres -d codegraph -c "\dt"

Ожидаемые таблицы: - users - api_keys - sessions - dialogue_turns - audit_log - background_jobs - token_blacklist

Шаг 4: Создание администратора¶

# Создание пользователя-администратора с именем и паролем
python -m src.api.cli create-admin --username admin --password <ваш_пароль_администратора>

# При необходимости можно добавить электронную почту
python -m src.api.cli create-admin --username admin --password <пароль> --email admin@example.com

Сохраните учетные данные администратора — они понадобятся для доступа к API.

Шаг 5: Настройка поставщика LLM (необязательно)¶

Сервер API может работать без настроенного поставщика LLM (для тестирования). Настройте поставщика LLM для полной функциональности:

Вариант A: GigaChat (рекомендуется для России)¶

# Установите переменную окружения
export GIGACHAT_AUTH_KEY="ваш_ключ_аутентификации"

# Обновите config.yaml
# llm:
#   provider: gigachat

Подробности см. в разделе Интеграция GigaChat.

Вариант B: Локальная LLM (llama-cpp-python)¶

# Установите llama-cpp-python с поддержкой CUDA
CMAKE_ARGS="-DLLAMA_CUDA=on" pip install llama-cpp-python

# Скачайте модель (рекомендуется Qwen3-Coder-30B)
# Поместите в: ~/.lmstudio/models/

# Обновите config.yaml
# llm:
#   provider: local
#   model_path: путь/к/модели.gguf

Вариант C: OpenAI API¶

export OPENAI_API_KEY="ваш_api_ключ"

# Обновите config.yaml
# llm:
#   provider: openai
#   model: gpt-4

Шаг 6: Запуск сервера API¶

# Установите URL базы данных (если ещё не установлен)
export DATABASE_URL="postgresql+asyncpg://postgres:your_password@localhost:5432/codegraph"

# Запуск сервера
python -m src.api.cli run --host 127.0.0.1 --port 8000

# Для разработки с автоматической перезагрузкой:
python -m src.api.cli run --host 127.0.0.1 --port 8000 --reload

Сервер запустится по адресу http://127.0.0.1:8000

Шаг 7: Проверка установки¶

Доступ к документации API¶

Откройте браузер и перейдите по следующим ссылкам: - Swagger UI: http://127.0.0.1:8000/api/docs - ReDoc: http://127.0.0.1:8000/api/redoc

Проверка конечной точки работоспособности¶

curl http://127.0.0.1:8000/api/v1/health

Ожидаемый ответ:

{
  "status": "healthy",
  "version": "1.0.0",
  "components": {
    "database": {
      "status": "healthy",
      "database": "postgresql",
      "version": "PostgreSQL 17.x ..."
    }
  }
}

Проверка аутентификации¶

# Получение токена доступа
curl -X POST http://127.0.0.1:8000/api/v1/auth/token \
  -H "Content-Type: application/json" \
  -d '{"username":"admin","password":"your_admin_password"}'

Ожидаемый ответ:

{
  "access_token": "eyJ...",
  "refresh_token": "eyJ...",
  "token_type": "bearer",
  "expires_in": 1800
}

Проверка защищённой конечной точки¶

# Замените TOKEN на полученный ранее access_token
curl http://127.0.0.1:8000/api/v1/scenarios \
  -H "Authorization: Bearer TOKEN"

Шаг 8: Настройка данных CPG¶

CodeGraph использует предварительно экспортированные данные CPG, хранящиеся в DuckDB. Если у вас есть данные CPG:

# Поместите вашу базу данных CPG в каталог проектов
cp /path/to/myproject.duckdb data/projects/myproject.duckdb

# Обновите config.yaml с указанием пути
# cpg:
#   db_path: data/projects/myproject.duckdb

Чтобы создать базу данных CPG из исходного кода, см. Руководство по импорту проектов.

Примечание: Данные CPG генерируются GoCPG непосредственно в формат DuckDB.

Устранение неполадок¶

Не удалось подключиться к PostgreSQL¶

Ошибка: connection to server at "localhost" failed

Решение:

# Проверьте, запущен ли PostgreSQL
# Windows:
Get-Service postgresql*

# Linux:
sudo systemctl status postgresql

# Запустите, если не запущен
sudo systemctl start postgresql

Ошибка аутентификации по паролю¶

Ошибка: password authentication failed for user "postgres"

Решение:

# Сбросьте пароль пользователя postgres
# Linux:
sudo -u postgres psql -c "ALTER USER postgres PASSWORD 'new_password';"

# Обновите DATABASE_URL с новым паролем
export DATABASE_URL="postgresql+asyncpg://postgres:new_password@localhost:5432/codegraph"

База данных не существует¶

Ошибка: database "codegraph" does not exist

Решение:

# Вручную создайте базу данных
psql -U postgres -c "CREATE DATABASE codegraph ENCODING 'UTF8';"

# Затем снова выполните init-db
python -m src.api.cli init-db

Порт 8000 уже используется¶

Ошибка: error while attempting to bind on address ('127.0.0.1', 8000)

Решение:

# Найдите процесс, использующий порт 8000
# Windows:
netstat -ano | findstr :8000

# Завершите процесс (замените PID на реальный идентификатор процесса)
taskkill /F /PID <PID>

# Linux:
lsof -ti:8000 | xargs kill -9

# Или используйте другой порт
python -m src.api.cli run --host 127.0.0.1 --port 8001

CUDA не найдена (для локальной LLM)¶

Ошибка: CUDA not available

Решение:

# Проверьте установку CUDA
nvcc --version
nvidia-smi

# Переустановите PyTorch с поддержкой CUDA
pip uninstall torch
pip install torch --index-url https://download.pytorch.org/whl/cu118

Недостаточно памяти¶

Для систем с ограниченным объёмом ОЗУ:

# Уменьшите параметры в config.yaml
retrieval:
  batch_size: 50  # Было 100
  top_k: 5        # Было 10

Дальнейшие шаги¶

Конфигурация — Настройка параметров API, аутентификации и поставщиков
Краткое руководство — Начало работы с типовыми сценариями использования
Руководство пользователя TUI — Изучение работы с системой
Справочник API — Обзор конечных точек API
Устранение неполадок — Распространённые проблемы и их решения