Skip to main content
Back to top
Ctrl
+
K
入门指南
安装教程
快速开始
算法特性
量化
投机采样
EAGLE
SpecExit
D-Cut
DFlare
稀疏注意力
Token 压缩
文生图/视频/3D压缩
Distillation
Quantization-Aware Distillation
模型支持
混元模型量化
HunyuanOCR量化
DeepSeek量化
Qwen量化
Qwen2.5VL量化指南
Qwen3-Omni量化指南
Hy-MT1.5 量化
部署文档
压缩模型部署
性能表现
量化benchmark
投机采样Benchmark
设计文档
设计文档
Repository
Suggest edit
.md
.pdf
投机采样
投机采样
#
投机采样是一种用于自回归大模型中进行并行解码的技术,可以在效果无损的前提下,有效加速大模型推理计算。
Contents
EAGLE
SpecExit
D-Cut
DFlare