CurvOpt-LLM Optimizer

Preset Model

Custom Model ID (overrides dropdown)

Leave blank to use dropdown selection

Device

Max Perplexity Increase Tolerance (%)

0 5

Calibration Samples (1–32)

1 32

Sequence Length

Calibration Dataset

FP16

BF16

INT8 (CUDA only)

Real-Time Logs

Base TPS

Optimized TPS

Speedup ×

Base Memory (MB)

Optimized Memory (MB)

Memory Saved %

Base Perplexity

Optimized Perplexity

PPL Δ %

Optimized Model (ZIP — load with HuggingFace)