§ 3.2.1

G.711 — la référence.

Inventé en 1972 par l'UIT. Échantillonnage 8 kHz, 8 bits par échantillon, soit 64 kbit/s. Pas de compression — juste une quantification logarithmique non linéaire (µ-law en Amérique, A-law en Europe). C'est la même voix que le RTC analogique numérisé.

Le défaut absolu de la téléphonie. Tout client SIP le parle, tout opérateur l'accepte. À l'INVITE, on le propose toujours en dernier dans la liste des codecs — au cas où aucun autre ne passerait.

# SDP
m=audio 49170 RTP/AVP 0 8
a=rtpmap:0 PCMU/8000  # µ-law
a=rtpmap:8 PCMA/8000  # A-law
§ 3.2.2

G.722 — la HD.

Échantillonnage 16 kHz au lieu de 8. La bande passante audible monte à 7 kHz au lieu de 3.4 kHz du RTC. La voix gagne en présence, les consonnes fricatives (s, f, ch) deviennent distinctes. Toujours 64 kbit/s, par sous-bande.

Conçu en 1988, popularisé par les téléphones de salle de réunion Polycom et les hardphones SIP modernes (Yealink, Snom, Cisco). Faiblesse : ne supporte pas le DTMF in-band. Il faut RFC 2833 ou INFO pour les touches.

# SDP
m=audio 49170 RTP/AVP 9
a=rtpmap:9 G722/8000  # oui, 8000, c'est une oddité historique
§ 3.2.3

G.729 — l'économe.

8 kbit/s, soit huit fois moins que G.711. Algorithme CELP (Code Excited Linear Prediction) qui modélise le conduit vocal. Latence d'encodage de 10 ms, plus le buffer Look-Ahead de 5 ms.

Longtemps cantonné aux liens IP coûteux, aux ATA d'entreprise et aux centrex bridés. Sa licence était payante ; les brevets ont expiré en janvier 2017, ouvrant son usage libre.

# SDP
m=audio 49170 RTP/AVP 18
a=rtpmap:18 G729/8000
a=fmtp:18 annexb=no  # désactive la suppression de silence
§ 3.2.4

Opus — le moderne.

RFC 6716, 2012. Le bon défaut d'aujourd'hui. Conçu par Mozilla, Xiph et Skype pour Internet : bitrate variable de 6 à 510 kbit/s, échantillonnage de 8 à 48 kHz, latence aussi basse que 5 ms. Fusion de deux codecs (SILK pour la voix, CELT pour la musique).

Adaptatif : si la perte de paquets monte, Opus baisse automatiquement son débit et active la correction d'erreurs en avant (FEC). C'est ce qui fait que les visios WebRTC restent intelligibles quand le réseau patine.

# SDP
m=audio 49170 RTP/AVP 96
a=rtpmap:96 opus/48000/2
a=fmtp:96 useinbandfec=1; maxplaybackrate=48000
§ 3.2.5

Le tableau complet.

CodecBitrateBande audibleMOSNote
G.71164 kbit/s3.4 kHz4.1Universel, sans compression.
G.72264 kbit/s7 kHz4.5HD voice, hardphones modernes.
G.72616–40 kbit/s3.4 kHz3.8ADPCM, vieux DECT IP.
G.7298 kbit/s3.4 kHz3.9Économe en bande, libre depuis 2017.
iLBC13.3 / 15.2 kbit/s3.4 kHz4.1Résilient aux pertes (jusqu'à 10 %).
Opus6–510 kbit/s20 kHz4.5+Adaptatif, le bon défaut.
EVS5.9–128 kbit/s20 kHz4.6+VoLTE, super-wideband, 3GPP.
§ 3.2.6

Transcodage.

Quand deux UA ne partagent aucun codec commun, un intermédiaire (proxy, SBC, MCU) doit transcoder. Coûteux en CPU et toxique pour la qualité : décompresser puis recompresser introduit des artefacts cumulatifs.

Règle : si l'on peut éviter le transcodage, on l'évite. Toujours proposer au moins G.711 dans son SDP, même si l'on préfère Opus. C'est l'assurance que l'appel passera, fût-ce en qualité dégradée.

§ 3.2.7

« En 2026, choisir Opus quand on peut, G.711 quand on doit, ne rien forcer sans raison. » — principe directeur

Suivant : Le SDP en détail →