Public / onnxruntime / 4190c29d226

Skip to sidebar navigation
Skip to content

Commits

Edward Chen authored and GitHub committed 4190c29d22606 Jan 2024

Add MatMulNBits accuracy_level parameter to quantization utilities. (#19015)

Allow MatMulNBits `accuracy_level` attribute (added in #17669) to be set to a particular value when the model is quantized.