介绍
本篇博客介绍论文[2306.00978] AWQ:
Activation-aware Weight Quantization for LLM Compression and
Acceleration提出的一种针对权重的训练后量化方法。
2024-10-27