Un estándar es un conjunto de normas que permiten definir una serie de actividades de una forma pautada. La telefonía IP tiene sus propios estándares, y realmente hay muchos donde escoger, pero nos centraremos en uno solo: el SIP (Session Initiation Protocol). Este protocolo es el más conocido y fiable de los que existen para Telefonía IP.
Creado en 1996, se caracteriza por su versatilidad, y por haber sido estandarizado por la IETF (Internet Engineering Task Force), lo que lo ha hecho extremadamente popular. Además, se trata de un protocolo abierto, lo que siempre da mucha más libertad a la hora de realizar modificaciones y obtener actualizaciones.
El SIP incluye dos funciones básicas: determinar la ubicación de los usuarios, aportando movilidad, además de establecer, modificar y terminar las sesiones entre usuarios. Y esto lo realiza de manera transparente, permitiendo el mapeo de nombres y la redirección de servicios sin demasiadas complicaciones. La verdad es que el sistema que emplea es realmente sencillo y, sobre todo, compatible con todo tipo de dispositivos.

Las ventajas de SIP respecto a otros protocolos como H.323 o IAX2 son cuantiosas:
- Requiere de menos uso de CPU para las transacciones, por lo que se podrán llevar a cabo un mayor número de las mismas
- Llamadas y conexiones son independientes, aunque ambas residan en la misma capa de transporte.
- La autentificación de origen y destino se realiza mediante mecanismos HTTP, por lo que es comprensible por las personas.
- Puede identificar una llamada y trasladarla a cualquier número de dispositivos de forma simultánea.
- Puede usar cifrado de datos SSH o S-HTTP en cualquier capa de transporte
Además de un protocolo, requeriremos de un códec para codificar la voz y enviarla a través de la Red. Según el que usemos, se requerirá de más o menos ancho de banda. Tenemos los siguientes:
- G.711: bit-rate de 56 ó 64 Kbps
- G.722: bit-rate de 48, 56 ó 64 Kbps
- G.723: bit-rate de 5,3 ó 6,4 Kbps
- G.728: bit-rate de 16 Kbps
- G.729: bit-rate de 8 ó 13 Kbps
El más usado es el último, el 729, pues es el que menos ancho de banda requiere, aunque la conversión de audio demanda más uso de CPU que otros (pero con las máquinas que se usan hoy en día eso tampoco resulta un gran inconveniente).