La voix, pesée et compressée.
Un codec décide combien la voix pèse, à quel point elle ressemble à elle-même, et combien de millisecondes elle met à atteindre l'oreille de l'autre. Trois compromis, jamais simultanés.
G.711 — la référence.
Inventé en 1972 par l'UIT. Échantillonnage 8 kHz, 8 bits par échantillon, soit 64 kbit/s. Pas de compression — juste une quantification logarithmique non linéaire (µ-law en Amérique, A-law en Europe). C'est la même voix que le RTC analogique numérisé.
Le défaut absolu de la téléphonie. Tout client SIP le parle, tout opérateur l'accepte. À l'INVITE, on le propose toujours en dernier dans la liste des codecs — au cas où aucun autre ne passerait.
# SDP
m=audio 49170 RTP/AVP 0 8
a=rtpmap:0 PCMU/8000 # µ-law
a=rtpmap:8 PCMA/8000 # A-law
G.722 — la HD.
Échantillonnage 16 kHz au lieu de 8. La bande passante audible monte à 7 kHz au lieu de 3.4 kHz du RTC. La voix gagne en présence, les consonnes fricatives (s, f, ch) deviennent distinctes. Toujours 64 kbit/s, par sous-bande.
Conçu en 1988, popularisé par les téléphones de salle de réunion Polycom et les hardphones SIP modernes (Yealink, Snom, Cisco). Faiblesse : ne supporte pas le DTMF in-band. Il faut RFC 2833 ou INFO pour les touches.
# SDP m=audio 49170 RTP/AVP 9 a=rtpmap:9 G722/8000 # oui, 8000, c'est une oddité historique
G.729 — l'économe.
8 kbit/s, soit huit fois moins que G.711. Algorithme CELP (Code Excited Linear Prediction) qui modélise le conduit vocal. Latence d'encodage de 10 ms, plus le buffer Look-Ahead de 5 ms.
Longtemps cantonné aux liens IP coûteux, aux ATA d'entreprise et aux centrex bridés. Sa licence était payante ; les brevets ont expiré en janvier 2017, ouvrant son usage libre.
# SDP
m=audio 49170 RTP/AVP 18
a=rtpmap:18 G729/8000
a=fmtp:18 annexb=no # désactive la suppression de silence
Opus — le moderne.
RFC 6716, 2012. Le bon défaut d'aujourd'hui. Conçu par Mozilla, Xiph et Skype pour Internet : bitrate variable de 6 à 510 kbit/s, échantillonnage de 8 à 48 kHz, latence aussi basse que 5 ms. Fusion de deux codecs (SILK pour la voix, CELT pour la musique).
Adaptatif : si la perte de paquets monte, Opus baisse automatiquement son débit et active la correction d'erreurs en avant (FEC). C'est ce qui fait que les visios WebRTC restent intelligibles quand le réseau patine.
# SDP
m=audio 49170 RTP/AVP 96
a=rtpmap:96 opus/48000/2
a=fmtp:96 useinbandfec=1; maxplaybackrate=48000
Le tableau complet.
| Codec | Bitrate | Bande audible | MOS | Note |
|---|---|---|---|---|
| G.711 | 64 kbit/s | 3.4 kHz | 4.1 | Universel, sans compression. |
| G.722 | 64 kbit/s | 7 kHz | 4.5 | HD voice, hardphones modernes. |
| G.726 | 16–40 kbit/s | 3.4 kHz | 3.8 | ADPCM, vieux DECT IP. |
| G.729 | 8 kbit/s | 3.4 kHz | 3.9 | Économe en bande, libre depuis 2017. |
| iLBC | 13.3 / 15.2 kbit/s | 3.4 kHz | 4.1 | Résilient aux pertes (jusqu'à 10 %). |
| Opus | 6–510 kbit/s | 20 kHz | 4.5+ | Adaptatif, le bon défaut. |
| EVS | 5.9–128 kbit/s | 20 kHz | 4.6+ | VoLTE, super-wideband, 3GPP. |
Transcodage.
Quand deux UA ne partagent aucun codec commun, un intermédiaire (proxy, SBC, MCU) doit transcoder. Coûteux en CPU et toxique pour la qualité : décompresser puis recompresser introduit des artefacts cumulatifs.
Règle : si l'on peut éviter le transcodage, on l'évite. Toujours proposer au moins G.711 dans son SDP, même si l'on préfère Opus. C'est l'assurance que l'appel passera, fût-ce en qualité dégradée.
« En 2026, choisir Opus quand on peut, G.711 quand on doit, ne rien forcer sans raison. » — principe directeur
Suivant : Le SDP en détail →