quantization

micronet, a model compression and deploy lib. compression: 1、quantization: quantization-aware-training(QAT), High-Bit(>2b)(DoReFa/Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference)、Low-Bit(≤2b)/Ternary and Binary(TWN/BNN/XNOR-Net); post-training-quantization(PTQ), 8-bit(tensorrt); 2、 pruning: normal、regular and group convolutional channel pruning; 3、 group convolution structure; 4、batch-normalization fuse for quantization. deploy: tensorrt, fp32/fp16/int8(ptq-calibration)、op-adapt(upsample)、dynamic_shape

Updated Oct 6, 2021
Python

tensorflow / model-optimization

Star

A toolkit to optimize ML models for deployment for Keras and TensorFlow, including quantization and pruning.

machine-learning sparsity compression deep-learning tensorflow optimization keras ml pruning quantization model-compression quantized-training quantized-neural-networks quantized-networks

Updated Aug 29, 2022
Python

quic / aimet

Star

AIMET is a library that provides advanced quantization and compression techniques for trained neural network models.

open-source machine-learning opensource deep-neural-networks compression deep-learning pruning quantization auto-ml network-quantization network-compression

Updated Sep 13, 2022
Python

PaddlePaddle / PaddleSlim

Star

PaddleSlim is an open-source library for deep model compression and architecture search.

sparsity compression detection transformer segmentation pruning quantization nas bert tensorrt distillation ernie yolov5 yolov6 yolov7

Updated Sep 13, 2022
Python

openvinotoolkit / training_extensions

Star

Trainable models and NN optimization tools

sparsity computer-vision deep-learning tensorflow detection pytorch text-recognition ssd segmentation face-recognition text-detection quantization super-resolution openvino neural-networks-compression

Updated Sep 13, 2022
Python

neuralmagic / deepsparse

Star

Neural network inference engine that delivers GPU-class performance for sparsified models on CPUs

Updated Sep 13, 2022
Python

guan-yuan / awesome-AutoML-and-Lightweight-Models

Star

A list of high-quality (newest) AutoML works and lightweight models including 1.) Neural Architecture Search, 2.) Lightweight Structures, 3.) Model Compression, Quantization and Acceleration, 4.) Hyperparameter Optimization, 5.) Automated Feature Engineering.

tensorflow pytorch hyperparameter-optimization awesome-list quantization nas automl model-compression neural-architecture-search meta-learning architecture-search quantized-training model-acceleration automated-feature-engineering quantized-neural-network

Updated Jun 19, 2021

htqin / awesome-model-quantization

Star

A list of papers, docs, codes about model quantization. This repo is aimed to provide the info for model quantization research, we are continuously improving the project. Welcome to PR the works (papers, repositories) that are missed by the repo.

awesome deep-learning quantization binary-neural-networks

Updated Aug 6, 2022

Xilinx / brevitas

Star

Brevitas: quantization-aware training in PyTorch

text-to-speech fpga pytorch speech-recognition neural-networks image-classification xilinx quantization hardware-acceleration brevitas

Updated Sep 10, 2022
Python

huggingface / optimum

Star

🏎️ Accelerate training and inference of 🤗 Transformers with easy to use hardware optimization tools

training optimization intel transformers inference pytorch quantization onnx onnxruntime graphcore habana

Updated Sep 13, 2022
Python

csarron / awesome-emdl

Star

Embedded and mobile deep learning research resources

deep-neural-networks deep-learning inference pruning quantization neural-network-compression mobile-deep-learning embedded-ai efficient-neural-networks mobile-ai mobile-inference

Updated Jul 30, 2022

ImageOptim / libimagequant

Star

Palette quantization library that powers pngquant and other PNG optimizers

palette quality visual-studio conversion callback minification image-optimization quantization rgba-pixels palette-generation pixel-array image-pixels pngquant

Updated Aug 25, 2022
Rust

intel / neural-compressor

Star

Intel® Neural Compressor (formerly known as Intel® Low Precision Optimization Tool), targeting to provide unified APIs for network compression technologies, such as low precision quantization, sparsity, pruning, knowledge distillation, across different deep learning frameworks to pursue optimal inference performance.

sparsity deep-learning pruning quantization knowledge-distillation auto-tuning low-precision quantization-aware-training post-training-quantization

Updated Sep 6, 2022
Python

openvinotoolkit / nncf

Star

Neural Network Compression Framework for enhanced OpenVINO™ inference

nlp sparsity compression tensorflow transformers pytorch classification pruning object-detection quantization semantic-segmentation bert hawq mmdetection mixed-precision-training quantization-aware-training

Updated Sep 13, 2022
Python

thulab / DeepHash

Star

An Open-Source Package for Deep Learning to Hash (DeepHash)

hashing deep-learning quantization similarity-search

Updated Nov 24, 2019
Python

Improve this page

Add a description, image, and links to the quantization topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the quantization topic, visit your repo's landing page and select "manage topics."

Learn more

Aug	SEP	Oct
	13
2021	2022	2023

quantization

Here are 344 public repositories matching this topic...

kornelski / pngquant

IntelLabs / distiller

IntelLabs / nlp-architect

huawei-noah / Pretrained-Language-Model

aaron-xichen / pytorch-playground

666DZY666 / micronet

tensorflow / model-optimization

quic / aimet

PaddlePaddle / PaddleSlim

openvinotoolkit / training_extensions

neuralmagic / deepsparse

guan-yuan / awesome-AutoML-and-Lightweight-Models

htqin / awesome-model-quantization

Xilinx / brevitas

huggingface / optimum

csarron / awesome-emdl

ImageOptim / libimagequant

intel / neural-compressor

openvinotoolkit / nncf

thulab / DeepHash

Improve this page

Add this topic to your repo