其他视觉 Token 压缩方法

目录

其他视觉 Token 压缩方法#

除了核心算法 IDPruner 外，AngelSlim 同样集成了多种业界主流的视觉 Token 压缩方案及基准（Baseline）方法：

运行示例#

1. 功能验证 (Smoke Test)#

使用 tools/test_token_pruning.py 快速验证指定策略在模型上的适配性与单次推理逻辑：

python tools/test_token_pruning.py \
    --config configs/qwen2_5_vl/pruning/scope_r0.75.yaml \
    --model_path "Qwen/Qwen2.5-VL-3B-Instruct"

Smoke Test 参数说明：

--config: 指向对应的策略 YAML 配置文件。
--model_path: 原始模型的本地路径或 HuggingFace ID。脚本将根据配置自动完成模型包装。

2. 精度评测 (Evaluation)#

使用 tools/run_token_pruning_evaluation.py 在标准数据集上评估剪枝后的模型性能。以下示例演示如何使用 SCOPE 策略在 TextVQA 任务上运行评测：

python tools/run_token_pruning_evaluation.py \
    --model_path "Qwen/Qwen2.5-VL-3B-Instruct" \
    --configs configs/qwen2_5_vl/pruning/scope_r0.75.yaml \
    --tasks textvqa \
    --batch_size 1 \
    --output_dir ./eval_results/scope_textvqa

Evaluation 参数说明：

--model_path: 原始模型的路径或 HuggingFace ID。
--configs: 指向一个或多个策略 YAML 配置文件（支持批量评测）。
--tasks: 指定 lmms-eval 支持的任务名称（如 textvqa, mmmu_val）。
--batch_size: 推理批大小。当前只支持 batch_size=1。
--output_dir: 评测报告与详细指标的保存路径。