Tutorial Install TensorRT dengan pip di Ubuntu

TensorRT dapat diinstal menggunakan pip untuk kebutuhan inference berbasis Python di Ubuntu dengan GPU NVIDIA, selama driver NVIDIA dan CUDA Toolkit sudah terpasang dan kompatibel. Proses instalasi dilakukan dengan menambahkan repository Python NVIDIA melalui nvidia-pyindex, lalu menginstal paket nvidia-tensorrt menggunakan pip, diikuti dengan verifikasi melalui import modul tensorrt di Python. Metode ini cocok untuk percepatan inference model seperti ONNX, PyTorch, dan TensorFlow di lingkungan AI production ringan, namun tidak ditujukan untuk pengembangan TensorRT berbasis C++ atau build engine kompleks.

By Ruby Abdullah · · tutorial
nvidiatensorrtpippython

TensorRT adalah library optimasi inference dari NVIDIA untuk mempercepat model deep learning (ONNX, PyTorch, TensorFlow) di GPU NVIDIA. Metode pip install cocok untuk inference Python-based, bukan untuk development C++.

Tutorial ini fokus pada TensorRT via pip, bukan via .deb atau SDK full.

1. Prasyarat Wajib

Pastikan semua komponen berikut sudah tersedia:

Ubuntu 20.04 / 22.04

GPU NVIDIA

Driver NVIDIA terinstal dan berfungsi

CUDA Toolkit terinstal

Python 3.8 – 3.11

NVIDIA Docker tidak wajib, tapi direkomendasikan

Cek GPU:

nvidia-smi

Cek CUDA:

nvcc --version

Jika CUDA belum ada, TensorRT tidak akan bisa digunakan meskipun pip install berhasil.

2. Cek Versi CUDA yang Digunakan

TensorRT sangat sensitif terhadap versi CUDA. Catat versi CUDA dari:

nvidia-smi

Contoh:

CUDA Version: 12.2

Ini penting untuk memilih versi TensorRT yang kompatibel.

3. Upgrade pip dan dependency dasar

python3 -m pip install --upgrade pip setuptools wheel

Disarankan menggunakan virtual environment:

python3 -m venv trt-env

source trt-env/bin/activate

4. Install TensorRT Menggunakan pip

TensorRT di pip tidak tersedia di PyPI publik, tetapi di repository NVIDIA.

Langkah 1: Install NVIDIA PyPI index

pip install nvidia-pyindex

Langkah 2: Install TensorRT

pip install nvidia-tensorrt

Jika ingin versi spesifik:

pip install nvidia-tensorrt==9.2.0

5. Verifikasi Instalasi TensorRT

Masuk ke Python:

python

Lalu jalankan:

import tensorrt as trt

print(trt.version)

Jika versi TensorRT muncul tanpa error, instalasi berhasil.

6. Verifikasi Akses CUDA dari TensorRT

import tensorrt as trt

logger = trt.Logger(trt.Logger.WARNING)

print("TensorRT OK, CUDA ready")

Jika tidak muncul error libnvinfer.so atau libcuda.so, berarti environment sudah benar.

7. Error Umum dan Solusinya

Error: libnvinfer.so not found

Penyebab:

CUDA tidak terdeteksi

Driver NVIDIA tidak cocok

Library path tidak terbaca

Solusi:

export LDLIBRARYPATH=/usr/local/cuda/lib64:$LDLIBRARYPATH

Tambahkan permanen:

echo 'export LDLIBRARYPATH=/usr/local/cuda/lib64:$LDLIBRARYPATH' >> ~/.bashrc

source ~/.bashrc

Error: CUDA driver version is insufficient

Penyebab:

Versi driver NVIDIA lebih rendah dari kebutuhan TensorRT

Solusi:

Upgrade driver NVIDIA

Gunakan versi TensorRT yang lebih lama dan kompatibel

8. Catatan Penting (Wajib Dibaca)

pip install nvidia-tensorrt hanya untuk Python inference

Tidak cocok untuk:

Plugin custom C++

Compile TensorRT engine via C++

Untuk production berat, disarankan:

NVIDIA Docker + TensorRT image

  • Atau install TensorRT via .deb

9. Ringkasan Singkat

Driver NVIDIA + CUDA

pip install nvidia-pyindex

pip install nvidia-tensorrt

import tensorrt

TensorRT siap untuk inference

Artikel Terkait

Tutorial Reflex: Membangun Web App Full-Stack dengan Python Murni

Reflex: Membangun Aplikasi Web Full-Stack dengan Python Murni Reflex memungkinkan Anda membangun aplikasi web lengkap — ...

Tutorial ColBERT & RAGatouille: Late-Interaction Retrieval untuk RAG

ColBERT & RAGatouille: Retrieval Late-Interaction untuk RAG yang Lebih Baik Sebagian besar sistem RAG mengandalkan dense...

Tutorial SGLang: Serving LLM Cepat dan Pemrograman Structured Generation

SGLang: Serving LLM yang Cepat dan Model Pemrograman untuk Generasi Terstruktur SGLang adalah dua hal dalam satu paket: ...

Tutorial TRL: Post-Training LLM dengan SFT, DPO, dan Reward Modeling

Post-Training LLM dengan TRL: SFT, Reward Modeling, dan DPO Setelah sebuah base language model selesai dipretraining, mo...