Voice over IP
Voice over IP (sigla VoIP; anche telefonia IP) è l'insieme di tecnologie che consente di trasmettere comunicazioni vocali e, più in generale, sessioni multimediali in tempo reale su reti basate sul protocollo IP, comprese Internet e reti private a commutazione di pacchetto.[1][2][3]
A differenza della telefonia tradizionale a commutazione di circuito, nel VoIP la voce e gli altri flussi media sono codificati e trasportati in forma di pacchetti su una rete IP.[1][4] Il termine è usato sia per le chiamate vocali sia, più in generale, per servizi come videotelefonia, videoconferenza e altre applicazioni di comunicazione multimediale interattiva.[4][2][3]
Descrizione
modificaIl VoIP non coincide con un singolo protocollo, ma con un insieme di protocolli, codec e componenti di rete che consentono l'instaurazione della sessione, il trasporto dei flussi audio e video e l'eventuale interconnessione con la rete telefonica pubblica commutata (PSTN).[2][4][3]
Le implementazioni VoIP non richiedono necessariamente l'uso dell'Internet pubblico: molte soluzioni operano interamente su reti IP private, aziendali o di operatore.[1][3]
Dal punto di vista funzionale, una soluzione VoIP separa di norma la segnalazione, usata per instaurare, modificare e terminare la sessione, dal trasporto dei media (audio, video e altri flussi associati).[2][4][5]
In una stessa architettura possono convivere terminali utente, proxy o registrar di segnalazione, media gateway e gateway verso la rete telefonica tradizionale, a seconda del modello di rete adottato.[2][3][6]
Storia
modificaFra i principali filoni di standardizzazione della telefonia su IP vi sono H.323, definito in ambito ITU per i sistemi multimediali su reti a pacchetto, e SIP, standardizzato dallo IETF come protocollo di segnalazione per creare, modificare e terminare sessioni multimediali.[3][2]
Nelle architetture contemporanee, SIP è un elemento fondamentale di numerosi sistemi VoIP ed è anche alla base di IMS, impiegato nelle reti mobili per servizi come VoLTE e VoNR.[2][5][7]
Architettura e funzionamento
modificaSegnalazione
modificaSIP è un protocollo di controllo di livello applicativo usato per instaurare, modificare e terminare sessioni con uno o più partecipanti.[2] Le caratteristiche dei flussi media, come codec, porte e tipi di contenuto, sono normalmente descritte tramite SDP.[5]
H.323 definisce invece un'architettura più ampia per comunicazioni multimediali su reti a pacchetto, comprendente terminali, gateway e altre entità di controllo.[3]
Nelle architetture con gateway scomposti sono stati inoltre usati protocolli di controllo come MGCP e H.248/Megaco per la gestione dei media gateway.[8][6]
Entità funzionali
modificaNelle architetture SIP, i terminali o le applicazioni che originano e ricevono richieste sono detti user agent (UA).[2] L'infrastruttura può includere proxy server, che inoltrano le richieste; registrar, che mantengono le associazioni fra l'identità dell'utente e i relativi recapiti di contatto; e redirect server, che restituiscono destinazioni alternative senza inoltrare direttamente la richiesta.[2]
Trasporto dei media
modificaPer il trasporto di audio e video in tempo reale viene comunemente utilizzato RTP (Real-time Transport Protocol), affiancato dal protocollo RTCP.[4] RTP è indipendente dal trasporto sottostante, ma nelle applicazioni VoIP è usato molto spesso sopra UDP, per ridurre l'overhead e la latenza.[4]
RTCP fornisce informazioni statistiche e di controllo sulla sessione, ma RTP non riserva risorse di rete e non garantisce di per sé la qualità del servizio.[4]
Per il trasporto dei toni DTMF e di altri eventi telefonici nelle sessioni RTP è comunemente utilizzato il formato definito da RFC 4733.[9]
Codec
modificaLa qualità percepita e il bitrate di una chiamata VoIP dipendono anche dai codec impiegati. La scelta del codec incide sulla banda occupata, sul ritardo di codifica e sulla robustezza rispetto a perdita di pacchetti e variazione del ritardo.[5][10]
Fra i codec storicamente associati alla telefonia IP figurano G.711, largamente usato per la sua semplicità e interoperabilità, e G.729, progettato per operare a bitrate più contenuti.[11][12]
Nelle applicazioni più recenti è diffuso anche Opus, codec progettato esplicitamente per comunicazioni interattive e conferenze in tempo reale; il codec include inoltre meccanismi di resilienza alla perdita di pacchetti e può operare su un ampio intervallo di bitrate.[10]
Attraversamento NAT
modifica
La presenza di NAT e firewall può ostacolare la creazione diretta dei flussi media fra terminali. Per questo molte implementazioni usano meccanismi di attraversamento NAT come ICE, che si appoggia a protocolli come STUN e TURN.[13][14][15]
Quando non è possibile stabilire un percorso diretto fra gli estremi, TURN consente il relay dei pacchetti media attraverso un nodo intermedio.[15]
Qualità del servizio
modificaLa qualità di una comunicazione VoIP dipende in larga misura dalle caratteristiche della rete IP sottostante, in particolare da latenza, variazione del ritardo (jitter), perdita di pacchetti, congestione e politiche di priorità del traffico.[4][1]
Per compensare la variabilità del ritardo, i terminali usano in genere jitter buffer lato ricezione; un aumento eccessivo del buffer può però migliorare la continuità audio a scapito della latenza complessiva della conversazione.[1][4]
Le implementazioni professionali possono inoltre appoggiarsi a meccanismi di QoS e a una progettazione della rete mirata a dare priorità ai flussi voce rispetto ad altro traffico dati.[1]
Sicurezza
modificaSul piano della sicurezza, la segnalazione SIP può essere protetta tipicamente tramite TLS, mentre i flussi media RTP possono essere protetti mediante SRTP (Secure Real-time Transport Protocol), che fornisce confidenzialità, autenticazione e protezione dal replay.[2][16]
Fra le principali superfici di rischio rientrano l'intercettazione dei flussi, la compromissione della segnalazione, il furto di credenziali, gli errori di configurazione e gli attacchi di denial of service ai componenti di rete.[1]
La sicurezza effettiva del servizio dipende tuttavia dall'intera catena di implementazione: terminali, server di segnalazione, media gateway, meccanismi di autenticazione, configurazione della rete e gestione delle chiavi.[1]
Interconnessione con la rete telefonica
modificaI servizi VoIP possono restare confinati a una piattaforma IP oppure interconnettersi con la rete telefonica tradizionale mediante gateway che traducono segnalazione e media fra ambienti IP e telefonici tradizionali.[3][6]
Questa interconnessione consente, per esempio, di effettuare chiamate tra terminali VoIP e utenze della PSTN, oppure di integrare centralini IP con reti telefoniche pubbliche o private.[3]
Per la trasmissione di fax attraverso reti IP è stata definita la raccomandazione ITU-T T.38, specificamente dedicata al fax over IP.[17]
Applicazioni
modificaIl VoIP è impiegato in softphone, telefoni IP, sistemi di videoconferenza, centralini IP-PBX, servizi di interconnessione con la PSTN e piattaforme di comunicazione unificata.[3][2][1]
Nelle reti mobili contemporanee, servizi come VoLTE e VoNR rappresentano implementazioni specializzate di fonia su IP basate su IMS, progettate per offrire servizi voce su accessi radiomobili a commutazione di pacchetto.[7]

Le applicazioni di comunicazione in tempo reale basate su browser fanno spesso ricorso a protocolli e meccanismi riconducibili a WebRTC, che possono anche interoperare con infrastrutture VoIP esistenti.[18]
Vantaggi e limitazioni
modificaFra i principali vantaggi del VoIP vi sono la convergenza tra voce e dati su un'unica infrastruttura IP, la maggiore flessibilità nell'integrazione con servizi software, la semplificazione della gestione centralizzata e, in molti scenari, la riduzione dei costi operativi e di interconnessione.[1]
Fra le limitazioni e le criticità si annoverano invece la dipendenza dalla qualità della rete IP, dagli apparati di rete locali, dall'alimentazione dei terminali e dalla connettività dati, nonché i problemi di attraversamento NAT, interoperabilità, sicurezza e gestione delle chiamate di emergenza, che dipendono dall'implementazione e dal quadro regolamentare applicabile.[1][2][14]
Note
modifica- 1 2 3 4 5 6 7 8 9 10 11 (EN) SP 800-58 – Security Considerations for Voice Over IP Systems, su NIST CSRC. URL consultato il 9 marzo 2026.
- 1 2 3 4 5 6 7 8 9 10 11 12 13 (EN) RFC 3261 – SIP: Session Initiation Protocol, su IETF Datatracker. URL consultato il 9 marzo 2026.
- 1 2 3 4 5 6 7 8 9 10 (EN) H.323 – Packet-based multimedia communications systems, su ITU. URL consultato il 9 marzo 2026.
- 1 2 3 4 5 6 7 8 9 (EN) RFC 3550 – RTP: A Transport Protocol for Real-Time Applications, su RFC Editor. URL consultato il 9 marzo 2026.
- 1 2 3 4 (EN) RFC 8866 – SDP: Session Description Protocol, su IETF Datatracker. URL consultato il 9 marzo 2026.
- 1 2 3 (EN) H.248.1 – Gateway control protocol: Version 3, su ITU. URL consultato il 9 marzo 2026.
- 1 2 (EN) Communication services (VoLTE/VoNR), su 3GPP. URL consultato il 9 marzo 2026.
- ↑ (EN) RFC 3435 – Media Gateway Control Protocol (MGCP) Version 1.0, su IETF Datatracker. URL consultato il 9 marzo 2026.
- ↑ (EN) RFC 4733 – RTP Payload for DTMF Digits, Telephony Tones, and Telephony Signals, su IETF Datatracker. URL consultato il 9 marzo 2026.
- 1 2 (EN) RFC 6716 – Definition of the Opus Audio Codec, su IETF Datatracker. URL consultato il 9 marzo 2026.
- ↑ (EN) G.711 – Pulse code modulation (PCM) of voice frequencies, su ITU. URL consultato il 9 marzo 2026.
- ↑ (EN) G.729 – Coding of speech at 8 kbit/s using CS-ACELP, su ITU. URL consultato il 9 marzo 2026.
- ↑ (EN) RFC 8445 – Interactive Connectivity Establishment (ICE): A Protocol for Network Address Translator (NAT) Traversal, su IETF Datatracker. URL consultato il 9 marzo 2026.
- 1 2 (EN) RFC 8489 – Session Traversal Utilities for NAT (STUN), su IETF Datatracker. URL consultato il 9 marzo 2026.
- 1 2 (EN) RFC 8656 – Traversal Using Relays around NAT (TURN), su IETF Datatracker. URL consultato il 9 marzo 2026.
- ↑ (EN) RFC 3711 – The Secure Real-time Transport Protocol (SRTP), su IETF Datatracker. URL consultato il 9 marzo 2026.
- ↑ (EN) T.38 – Procedures for real-time Group 3 facsimile communication over IP networks, su ITU. URL consultato il 9 marzo 2026.
- ↑ (EN) RFC 8825 – Overview: Real-Time Protocols for Browser-Based Applications, su IETF Datatracker. URL consultato il 9 marzo 2026.
Voci correlate
modificaAltri progetti
modifica
Wikizionario contiene il lemma di dizionario «Voice over IP»
Wikimedia Commons contiene immagini o altri file su Voice over IP
Collegamenti esterni
modifica- (EN) RFC 3261 – SIP: Session Initiation Protocol, su IETF Datatracker. URL consultato il 9 marzo 2026.
- (EN) RFC 3550 – RTP: A Transport Protocol for Real-Time Applications, su RFC Editor. URL consultato il 9 marzo 2026.
- (EN) H.323 – Packet-based multimedia communications systems, su ITU. URL consultato il 9 marzo 2026.
- (EN) Communication services (VoLTE/VoNR), su 3GPP. URL consultato il 9 marzo 2026.
| Controllo di autorità | LCCN (EN) sh98004350 · GND (DE) 4770362-3 · BNE (ES) XX545253 (data) · J9U (EN, HE) 987007534854905171 · NDL (EN, JA) 00959468 |
|---|