Table des matières

KVM : Activer le GPU passthrough

sysadmin, virtualisation, vm, kvm, gpu, passthrough

KVM : Activer le GPU passthrough

L'usage direct du GPU présent sur la carte vidéo additionnelle de l'hôte par une VM (GPU passthrough) permet d'obtenir le plus haut niveau de performance exigé par certaines applications s'exécutant sur un système virtualisé ayant besoin d'exploiter au maximum les capacités du GPU comme le rendu 3D ou le machine learning.

Le GPU et les contrôleurs intégrés à la carte graphique additionnelle de l'hôte (contrôleur audio, parfois usb et série) seront dédiés à l'usage exclusif de la VM : le système invité les pilotera directement.

Dans ce mode de fonctionnement, l'affichage sur l’hôte sera alors assuré par une autre carte vidéo : le plus souvent la carte intégrée à la carte mère.

Environnement

Ubuntu 25.10 (questing)
Linux 6.17.0-8-generic
libvirtd (libvirt) 11.6.0
AMD AMD Ryzen 7 7800X3D ; 32 GO RAM ; carte-mère Asus TUF GAMING X670E-PLUS WIFI

Prérequis

Pour que cela soit possible, le PCI passthrough doit être supporté matériellement :

Côté processeur : avec les fonctionnalité VT-d pour Intel ou AMD-IOV/AMD-Vi pour AMD ;
Côté carte mère : le IOMMU¹⁾ intégré au chipset permet aux périphériques qui en sont capables (GPU, contrôleur réseau, contrôleur de stockage) d'accéder directement à la mémoire (Direct Memory Access ou DMA) sans solliciter le CPU. Il assure également un rôle d'isolation des entrées/sorties et des accès à la mémoire pour éviter qu'une machine virtuelle ne fasse une attaque DMA sur le matériel du serveur physique.

C'est dans le BIOS de l’hôte qu'il faudra activer ces options.

Pour vérifier que les options de virtualisation nécessaires sont présentes sur le CPU de l’hôte :

Via la commande lscpu :

lscpu | grep "Virtualisation"

La commande doit retourner :

Virtualisation: VT-x   # Intel
Virtualisation: AMD-V  # AMD

Via le fichier /proc/cpuinfo :

Pour les processeurs Intel la fonctionnalité de vmx doit être listée ;
Pour les processeurs AMD la fonctionnalité de virtualisation du processeur est désignée SVM ²⁾.

# La commande doit retourner une valeur supérieure à 0
egrep -c '(vmx|svm)' /proc/cpuinfo

Vérifier que l'IOMMU est détecté :

journalctl -b 0 --grep "IOMMU"

Configuration de l’hôte

Rechercher l'ID matériel et le groupe IOMMU

Afin qu'il puisse être correctement assigné et utilisé par la VM, le GPU et les périphériques partageant le même groupe IOMMU doivent avoir leur pilote remplacé par le pilote VFIO afin qu'il ne soient pas utilisés par l’hôte.

On cherche d'abord à déterminer l'ID du GPU et des périphériques associés au même groupe IOMMU.

# Lister les périphérique PCI en affichant leurs IDs (ID Vendor:ID Device) et le groupe IOMMU
lspci -nn -vmm

Dans l'exemple ci-dessous, un extrait du retour de la commande lspci. La carte graphique 10de:2786 et le contrôleur audio 10de:22bc font parti du même groupe IOMMU, ils seront donc paramétrés ensembles.

...
Slot:   01:00.0
Class:  VGA compatible controller [0300]
Vendor: NVIDIA Corporation [10de]
Device: AD104 [GeForce RTX 4070] [2786]
SVendor:        Gigabyte Technology Co., Ltd [1458]
SDevice:        Device [40ed]
Rev:    a1
ProgIf: 00
IOMMUGroup:     13  
 
Slot:   01:00.1
Class:  Audio device [0403]
Vendor: NVIDIA Corporation [10de]
Device: AD104 High Definition Audio Controller [22bc]
SVendor:        Gigabyte Technology Co., Ltd [1458]
SDevice:        Device [40ed]
Rev:    a1
ProgIf: 00
IOMMUGroup:     13 
...

Les identifiants des périphériques correctement déterminés, on peut à présent modifier la configuration de l’hôte afin de forcer le chargement des pilotes VFIO en leiu et place des pilotes initiaux.

Affiche les pilotes utilisés par l’hôte avant modification :

lspci -kd 10de:2786
01:00.0 VGA compatible controller: NVIDIA Corporation AD104 [GeForce RTX 4070] (rev a1)
        Subsystem: Gigabyte Technology Co., Ltd Device 40ed
        Kernel driver in use: nvidia
        Kernel modules: nvidiafb, nouveau, nvidia_drm, nvidia

Ici on peut voir qu'on utilise le pilote propriétaire nvidia.

Mise à jour du bootloader

On met à jour grub via le fichier /etc/default/grub. on inclus les paramètres ci-dessous en fonction de l'architecture dans la variable GRUB_CMDLINE_LINUX_DEFAULT sans écraser les valeurs pré-existantes.

# Mettre à jour la variable sans écraser le contenu existant
GRUB_CMDLINE_LINUX_DEFAULT="intel_iommu=on iommu=pt vfio-pci.ids=10de:2786,10de:22bc"  # Intel

GRUB_CMDLINE_LINUX_DEFAULT="amd_iommu=on iommu=pt vfio-pci.ids=10de:2786,10de:22bc"    # AMD

Bien renseigner les valeurs des IDs retournés par la commande lspci.

update-grub

Mise à jour de modprobe

Modifier la configuration de modprobe en éditant le fichier /etc/modprobe.d/vfio.conf, insérer le contenu suivant :

options vfio-pci ids=10de:2786,10de:22bc

Empêcher le chargement des pilotes nvidia en créant le fichier /etc/modprobe.d/disable‑nvidia.conf avec le contenu suivant

blacklist nouveau
blacklist nvidia
blacklist nvidia_drm

Redémarrer le système

systemctl reboot

Si après redémarrage, l'affichage reste noir sur l' écran du système hôte c'est bon signe : il faut penser à connecter l'écran sur la sortie vidéo de la carte intégrée car la carte vidéo additionnelle n'est plus directement exploitée par l’hôte.

Après redémarrage vérifier les pilotes chargés pour le GPU sur le système hôte

lspci -kd 10de:2786

On doit obtenir un retour de la forme :

01:00.0 VGA compatible controller: NVIDIA Corporation AD104 [GeForce RTX 4070] (rev a1)
        Subsystem: Gigabyte Technology Co., Ltd Device 40ed
        Kernel driver in use: vfio-pci
        Kernel modules: nvidiafb, nouveau, nvidia_drm, nvidia

Si après redémarrage l'affichage n'a pas basculé et les pilotes vfio ne sont pas utilisés, confère section dépannage : GPU hôte non isolé.

Vérifier les logs

Une fois que l’affichage de l’hôte fonctionne avec la carte intégrée et que la carte additionnelle utilise les pilotes VFIO, le paramétrage coté l’hôte est terminé.

Vérifier cependant les logs et les services système. Dans le cas présent :

La command systemctl status retourne un état “dégradé” car le service nvidia-persistenced.service est en faute.
De nombreux messages sont générés en permanence dans le journal système et son occupation disque croit rapidement.

Exemple de messages :

déc. 30 13:19:56 juggernaut kernel: NVRM: No NVIDIA devices probed.
déc. 30 13:19:56 juggernaut kernel: nvidia-nvlink: Unregistered Nvlink Core, major device number 507
déc. 30 13:19:56 juggernaut (udev-worker)[3044]: nvidia: Process '/sbin/modprobe nvidia-modeset' failed with exit code 1.
déc. 30 13:19:56 juggernaut kernel: nvidia-nvlink: Nvlink Core is being initialized, major device number 507
déc. 30 13:19:56 juggernaut kernel: NVRM: GPU 0000:01:00.0 is already bound to vfio-pci.
déc. 30 13:19:56 juggernaut kernel: NVRM: The NVIDIA probe routine was not called for 1 device(s).
déc. 30 13:19:56 juggernaut kernel: NVRM: This can occur when another driver was loaded and 
                                     NVRM: obtained ownership of the NVIDIA device(s).
déc. 30 13:19:56 juggernaut kernel: NVRM: Try unloading the conflicting kernel module (and/or
                                     NVRM: reconfigure your kernel without the conflicting
                                     NVRM: driver(s)), then try loading the NVIDIA kernel module
                                     NVRM: again.

Comme la carte n'est plus utilisée directement par l’hôte, on désinstalle les pilotes propriétaire nvidia :

# Lister les paquets installés
apt list --installed | grep nvidia
 
# Suppression des paquets installés
apt remove --purge nvidia-*
apt autoremove --purge

Configuration de la VM

virt-install --name="mistral-7b" \
--metadata title="Test Mistral M8x7B",description="Mistral 8x7B / Ollama / Debian 13" \
--vcpus=8 \
--memory=16384 \
--osinfo=debian13 \
--features kvm_hidden=on \
--machine q35 \
--disk path=/home/yoann/KVM/mistral-7b/vda,bus=virtio,format=qcow2 \
--cdrom=/home/yoann/KVM/sysinstall/debian-13.2.0-amd64-netinst.iso \
--graphics spice \
--video virtio \
--network network=default,model=virtio \
--console pty,target_type=virtio \
--hostdev pci_0000_01_00_0 \
--hostdev pci_0000_01_00_1 \
--wait -1

Dépannage

GPU hôte non isolé

Dans un premier temps, on essaie de modifier la configuration de modprobe en tentant de charger le pilote vfio au moment où udev charge les pilotes du GPU. C'est la méthode recommandée car ainsi on n’agrandit pas initramfs en y ajoutant des pilotes.

Dans le fichier /etc/modprobe.d/vfio.conf ajouter la directive selon le pilote utilisé :

softdep drm pre: vfio-pci

Pour les pilotes propriétaires nvidia :

softdep nvidia pre: vfio-pci

Pour exemple le fichier après modification :

softdep nvidia pre: vfio-pci
options vfio-pci ids=10de:2786,10de:22bc

Si après redémarrage les pilotes vfio ne sont toujours pas chargés pour le GPU, il faudra modifier initramfs.

Modification du initramfs via dracut

Ubuntu utilise dracut pour générer/modifier le fichier initramfs. Créer le fichier de configuration /etc/dracut.conf.d/10-vfio.conf avec le contenu suivant :

force_drivers+=" vfio_pci vfio vfio_iommu_type1 "

Mettre à jour initramfs :

update-initramfs -u
systemctl reboot

C'est cette modification qui a fonctionné pour mon système hôte.

Références

¹⁾

Input-Output Memory Management Unit

²⁾

Secure Virtual Machine

wikinotes

Outils pour utilisateurs

Outils du site