Automated Code Review¶

Table of Contents¶

Overview
Quick Start
Basic Usage
Programmatic Usage
Architecture
Workflow Pipeline
Components
Definition of Done (DoD)
DoD Sources
DoD Formats
Definition of Done
Criterion Types
Interactive DoD Confirmation
DoD Validation
Configuration
config/code_review.yaml
Environment Variables
API Reference
ReviewWorkflow
ReviewVerdict
DoDValidationResult
Output Formats
JSON Output
Markdown Output
Troubleshooting
“DoD not found”
“DoD validation skipped”
“Jira extraction failed”
Examples
GitHub PR Integration
GitLab MR Integration
Manual DoD Creation

Overview¶

The automated code review system analyzes patches (git diffs, GitHub PRs, GitLab MRs) using Code Property Graph (CPG) analysis to provide comprehensive review feedback including:

Security vulnerability detection
Performance impact analysis
Error risk assessment
Architecture impact analysis
Definition of Done (DoD) validation

Quick Start¶

Basic Usage¶

# Run demo with default settings
python demo_patch_review.py

# With custom database
python demo_patch_review.py --db data/projects/postgres.duckdb

# Without DoD functionality
python demo_patch_review.py --no-dod

# Auto-generate DoD instead of extracting from PR
python demo_patch_review.py --auto-dod

# Interactive DoD confirmation (review and edit before proceeding)
python demo_patch_review.py --interactive
python demo_patch_review.py -i

Programmatic Usage¶

import duckdb
from src.patch_review import ReviewWorkflow

# Connect to CPG database
from src.project_manager import ProjectManager
conn = duckdb.connect(ProjectManager.get_active_db_path())

# Configure DoD settings
dod_config = {
    'auto_generate': True,
    'interactive': False,  # Set True for interactive DoD confirmation
    'extraction': {
        'sources': ['pr_body', 'jira', 'commit_message'],
        'formats': ['checklist', 'yaml', 'markdown'],
    },
}

# Create workflow
workflow = ReviewWorkflow(conn, dod_config=dod_config)

# Run review
verdict = workflow.run(
    patch_source='git_diff',
    patch_data={'diff': diff_content},
    pr_body=pr_description,  # For DoD extraction
    task_description=task_desc,  # For DoD generation
    interactive_mode=False,  # Set True for interactive DoD confirmation
)

# Access results
print(f"Score: {verdict.overall_score}/100")
print(f"Recommendation: {verdict.recommendation.value}")

# DoD validation results
if verdict.dod_validation:
    print(f"DoD Compliance: {verdict.dod_validation.compliance_score}%")

Architecture¶

Workflow Pipeline¶

parse_patch → extract_dod → [generate_dod] → [confirm_dod] → generate_delta_cpg
    ↓
run_analyzers → generate_verdicts → aggregate → validate_dod → format_output

Notes: - [generate_dod] runs only if DoD not found in sources - [confirm_dod] runs only in interactive mode (--interactive flag)

Components¶

Component	Description
`PatchParser`	Parses git diffs, GitHub PRs, GitLab MRs
`DoDExtractor`	Extracts DoD from PR body, Jira, commit message
`DoDGenerator`	Generates DoD using LLM when not found
`DoDConfirmer`	Interactive CLI confirmation for DoD (review, edit, skip)
`DeltaCPGGenerator`	Creates delta CPG overlay for changes
`Analyzers`	Call graph, dataflow, control flow, dependency
`VerdictGenerators`	Security, performance, error, architecture
`DoDValidator`	Validates DoD against review findings
`VerdictAggregator`	Combines verdicts into final review

Definition of Done (DoD)¶

DoD Sources¶

The system can extract DoD from multiple sources (configurable priority):

PR Body - Markdown checklist in PR/MR description
Jira - Custom field or description from linked ticket
Commit Message - DoD section in first commit
Manual Input - CLI or API input
Auto-Generated - LLM generates from task description

DoD Formats¶

Supported formats for DoD extraction:

Markdown Checklist¶

## Definition of Done

- [ ] Feature works as expected
- [ ] No security vulnerabilities introduced
- [ ] Unit tests added
- [ ] Documentation updated

YAML Block¶

dod:
  - description: Feature works as expected
    type: functional
  - description: Unit tests pass
    type: test

JSON Block¶

{
  "dod": [
    {"description": "Feature works", "type": "functional"},
    {"description": "Tests pass", "type": "test"}
  ]
}

Criterion Types¶

Type	Description	Validation
`functional`	Feature requirements	Manual review (cannot auto-validate)
`security`	No vulnerabilities	Security verdict score
`test`	Tests added/passing	Error verdict suggestions
`documentation`	Docs updated	Manual review
`performance`	No regressions	Performance verdict score
`code_quality`	Style compliance	Architecture verdict score

Interactive DoD Confirmation¶

When running with --interactive flag, users can review and modify DoD before the review proceeds:

============================================================
DEFINITION OF DONE - CONFIRMATION
============================================================

Current DoD (from pr_body):
----------------------------------------
  1. [FUNC] Feature works as expected
  2. [SECU] No security vulnerabilities introduced
  3. [TEST] Unit tests added for new functionality
  4. [PERF] No performance regressions
  5. [CODE] Code follows project style guidelines
----------------------------------------
Total: 5 items

Options:
  [c] Confirm and continue
  [e] Edit items
  [a] Add new item
  [r] Remove item
  [s] Skip DoD validation
  [q] Quit review

Options: - Confirm (c) - Accept current DoD and proceed with review - Edit (e) - Modify item descriptions and types - Add (a) - Add new DoD items with type selection - Remove (r) - Delete items from the list - Skip (s) - Skip DoD validation entirely (review proceeds without DoD) - Quit (q) - Cancel the review

Type shortcuts for adding/editing: | Shortcut | Type | |----------|------| | f | Functional | | s | Security | | t | Test | | d | Documentation | | p | Performance | | q | Code Quality |

DoD Validation¶

Each DoD item is validated against review findings:

Security items: Validated against security verdict (critical/high findings fail)
Test items: Validated against test suggestions count
Performance items: Validated against performance score
Code Quality items: Validated against architecture score
Functional/Documentation: Cannot be auto-validated (pending for manual review)

Configuration¶

config/code_review.yaml¶

# Definition of Done Configuration
dod:
  sources:
    - pr_body
    - jira
    - commit_message
    - manual
  source_priority:
    - pr_body
    - jira
    - commit_message
  formats:
    - checklist
    - yaml
    - markdown
    - json
  auto_generate: true
  interactive_confirm: false  # Enable for CLI confirmation prompts

  # Jira integration
  jira:
    url: ${JIRA_URL}
    api_key: ${JIRA_API_KEY}
    dod_field: "customfield_10001"

  # Validation settings
  validation:
    strict_mode: false
    blocking_severities:
      - critical
      - high

# Review Policy
policy:
  block_on_critical_security: true
  min_score_to_approve: 70.0
  require_dod_compliance: false
  min_dod_compliance_score: 60.0

# Verdict Weights
verdicts:
  weights:
    security: 0.35
    performance: 0.20
    error: 0.25
    architecture: 0.20
  dod_compliance_weight: 0.10

Environment Variables¶

Variable	Description
`JIRA_URL`	Jira server URL for DoD extraction
`JIRA_API_KEY`	Jira API authentication key
`GITHUB_TOKEN`	GitHub API token for PR access
`GITLAB_TOKEN`	GitLab API token for MR access

API Reference¶

ReviewWorkflow¶

workflow = ReviewWorkflow(
    conn: duckdb.DuckDBPyConnection,
    config: Optional[AggregationConfig] = None,
    policy: Optional[ReviewPolicy] = None,
    dod_config: Optional[Dict[str, Any]] = None,
)

verdict = workflow.run(
    patch_source: str,  # 'git_diff', 'github_pr', 'gitlab_mr'
    patch_data: Dict[str, Any],
    session_id: Optional[str] = None,
    policy: Optional[ReviewPolicy] = None,
    task_description: Optional[str] = None,
    pr_body: Optional[str] = None,
    jira_ticket: Optional[str] = None,
    interactive_mode: bool = False,
)

ReviewVerdict¶

class ReviewVerdict:
    patch_id: str
    overall_score: float  # 0-100
    recommendation: Recommendation  # APPROVE, REQUEST_CHANGES, BLOCK, COMMENT

    # Sub-verdicts
    security: SecurityVerdict
    performance: PerformanceVerdict
    error: ErrorVerdict
    architecture: ArchitectureVerdict

    # Findings
    all_findings: List[Finding]
    critical_count: int
    high_count: int
    medium_count: int
    low_count: int

    # DoD
    dod_validation: Optional[DoDValidationResult]
    dod_compliance_score: float  # 0-100

DoDValidationResult¶

class DoDValidationResult:
    dod: DefinitionOfDone
    total_items: int
    satisfied_count: int
    failed_count: int
    pending_count: int
    compliance_score: float  # 0-100
    blocking_failures: List[DoDItem]
    is_compliant: bool  # True if all items satisfied

Output Formats¶

JSON Output¶

{
  "patch_id": "PATCH_abc123",
  "overall_score": 45.5,
  "recommendation": "REQUEST_CHANGES",
  "dod_compliance_score": 60.0,
  "findings": [...],
  "dod_validation": {
    "compliance_score": 60.0,
    "items": [
      {"description": "...", "satisfied": true, "evidence": "..."},
      {"description": "...", "satisfied": false, "evidence": "..."}
    ]
  }
}

Markdown Output¶

## Patch Review Summary

**Overall Score:** 45/100
**Recommendation:** REQUEST_CHANGES

### Definition of Done

**Compliance Score:** 60%

- ✅ Feature works as expected
- ❌ No security vulnerabilities introduced
  - Evidence: Security issues found: SQL Injection
- ⏳ Unit tests added (pending manual review)

### Security Findings

1. [HIGH] SQL Injection vulnerability
   - Location: src/auth/login.py:14
   - CWE-89

Troubleshooting¶

“DoD not found”¶

If DoD is not being extracted:

Check that PR body contains DoD section with correct format
Verify dod.sources includes your source type
Check dod.formats includes your DoD format
Enable auto_generate: true to generate when not found

“DoD validation skipped”¶

DoD validation requires: - DoD successfully extracted or generated - Review verdict generated - No workflow errors

“Jira extraction failed”¶

Verify JIRA_URL and JIRA_API_KEY environment variables
Check Jira API permissions
Verify dod_field points to correct custom field

Examples¶

GitHub PR Integration¶

# Parse GitHub PR event
pr_data = {
    'number': 123,
    'title': 'Add authentication',
    'body': pr_body_with_dod,
    'diff_url': 'https://api.github.com/repos/...',
}

verdict = workflow.run(
    patch_source='github_pr',
    patch_data=pr_data,
    pr_body=pr_data['body'],
)

GitLab MR Integration¶

mr_data = {
    'iid': 456,
    'title': 'Add authentication',
    'description': mr_description_with_dod,
}

verdict = workflow.run(
    patch_source='gitlab_mr',
    patch_data=mr_data,
    pr_body=mr_data['description'],
)

Manual DoD Creation¶

from src.patch_review.dod import DoDExtractor

extractor = DoDExtractor()
dod = extractor.create_manual_dod(
    items=[
        "Feature works as expected",
        "No security vulnerabilities",
        "Unit tests added",
    ],
    types=["functional", "security", "test"],
)