Qué es un socket TCP o UDP y qué diferencias hay con los puertos
Cuando dos hosts (ordenadores, smartphones o cualquier dispositivo conectado a la red) necesitan comunicarse entre sí, es necesario que abran un socket TCP o UDP para permitir la comunicación a través de la correspondiente IP (ya sea pública o privada) y también los puertos. Todas las comunicaciones entre dos o más hosts se realizan a nivel de capa de transporte, ya que es la primera capa donde hay una comunicación punto a punto entre dos o más equipos, y aquí podríamos usar el protocolo TCP o bien el protocolo UDP. Hoy en RedesZone os vamos a explicar todo sobre qué es un socket y qué diferencias hay con los típicos puertos del router.
Hay dos protocolos que tienen mucho que ver con el tráfico de Internet, ya que hay que tener claro que se compone de una gran multitud de transferencias de manera constantes entre servidores y dispositivos. Pues bien, dichos datos se envían entre dos protocolos en concreto: el TCP y el UDP. En este caso, por más que quieras saber cuáles son sus respectivas ventajas, así como inconvenientes, lo cierto es que aquí vamos a ver los dos tipos de sockets que existen: aquellos que usan el protocolo de datagramas de usuario, conocido como UDP, o aquellos que usan el protocolo de control de la transmisión, llamado TCP. Por ello, y como no podía ser de otra manera, toca ver también para qué sirve un socket en sí.
Qué es un Socket y para qué sirve
Cuando dos procesos que están en hosts diferentes necesitan intercambiar información a través de la red, ya sea la red local o Internet, es necesario que abran un socket para establecer la comunicación y también para intercambiar cualquier flujo de datos. Generalmente el flujo de datos se hace de forma fiable y ordenada, no obstante, dependemos de si los procesos están utilizando el protocolo TCP o el protocolo UDP, a continuación, os explicamos brevemente las principales características de ambos protocolos:
- El protocolo TCP es un protocolo de la capa de transporte que es orientado a conexión, esto significa que antes de intercambiar los datos reales hay un paso previo para establecer una comunicación. Este protocolo también garantiza que toda la transmisión de los datos se hace sin errores, el propio TCP se encarga de reenviar los datos nuevamente en caso de que el receptor no los reciba a tiempo o los reciba dañados, además, garantiza también el orden, por lo que nos aseguramos de que los procesos van a recibir todos los datos en orden desde su origen.
- En el caso del protocolo UDP, no es orientado a conexión, no hay un paso previo en la comunicación sino que se envían los datos directamente. Este protocolo no garantiza que la transmisión se realice sin errores, aunque hará todo lo posible para que sí lo haga, además, tampoco garantiza el orden de los datagramas que el origen envíe al destino. La parte positiva de UDP es que tiene una cabecera muy pequeña y es muy rápido, ya que no hay una fase de establecimiento de la conexión.
Para que dos procesos puedan comunicarse entre sí, es necesario que un proceso sea capaz de localizar al otro, y que ambos procesos sean capaces de intercambiar información a través de la red. Por supuesto, estamos usando una arquitectura cliente-servidor, por lo que uno de los dos procesos es el que debe iniciar la comunicación. Para que dos procesos se comuniquen necesitamos tener un socket.
Un socket, independientemente de si usamos el protocolo TCP o el protocolo UDP, viene definido por los siguientes parámetros:
- Protocolo de la capa de transporte utilizado: TCP o UDP
- Dirección IP de origen: puede ser una IP pública o privada.
- Dirección IP de destino: puede ser una IP pública o privada.
- Puerto de origen o local: este puerto suele estar entre los puertos 49152 hasta 65535, son los denominados como puertos dinámicos o privados. Pero no tiene por qué ser así, puede utilizar cualquier puerto de origen, por ejemplo, un servidor web que usa el puerto 443 para las conexiones HTTPS usará el puerto de origen 443 para las conexiones.
- Puerto de destino o remoto: este puerto puede ser cualquier puerto, es necesario que el otro proceso o host esté escuchando este puerto.
Gracias a todos estos parámetros, podemos hacer que cada una de las conexiones que se realicen sean únicas, de esta forma, tanto el origen como el destino podrán identificar perfectamente la conexión y empezar a intercambiar datos.
¿Cuántos socket se pueden tener en un equipo?
Para cada una de las conexiones que realizamos fuera de nuestro equipo, necesitamos de un socket para que podamos intercambiar información entre los diferentes procesos. En un equipo en concreto podemos tener una gran cantidad de socket abiertos, aunque esto dependerá tanto del hardware del equipo como también del sistema operativo, ya que es el sistema operativo quien se encargará de gestionar todos los sockets (crearlos y borrarlos). Cuando abrimos un nuevo socket, este debe ser único para identificar la conexión unívocamente.
En el caso de los servidores web, cada una de las conexiones de los clientes está definida por un socket, por ejemplo, imaginemos que se conectan a nuestro servidor web un total de tres clientes, cada socket será diferente, además, dependiendo de si miramos el estado de la conexión en nuestro equipo local o en el remoto, la pareja de IP y de puertos cambiará de origen a destino y viceversa.
Ya en el siguiente ejemplo, podemos ver los socket creados en un servidor web, mirando estos socket desde el propio servidor web.
- Usuario 1
- Protocolo: TCP.
- IP origen: 77.77.77.77 (el cliente).
- IP destino: 88.88.88.88 (nosotros).
- Puerto origen o local: 49152 (el cliente).
- Puerto destino o remoto: 443 (nosotros, usamos HTTPS).
En el caso del segundo usuario, tendríamos:
- Usuario 2
- Protocolo: TCP.
- IP origen: 71.71.71.71 (el cliente).
- IP destino: 88.88.88.88 (nosotros).
- Puerto origen o local: 49152 (el cliente).
- Puerto destino o remoto: 443 (nosotros, usamos HTTPS).
Y en este caso solamente ha cambiado la IP de origen, pero en cuanto cambia uno de los cuatro parámetros ya tenemos un nuevo socket que permite identificar la conexión de forma unívoca. Ese cliente puede seguir usando el puerto de origen 49152 como el primero, pero la IP de origen será distinta. En cuanto uno de los cuatro parámetros cambia, ya estamos en otro proceso totalmente diferente y no hay ningún problema para identificarlo adecuadamente.
Cómo ver todos los sockets en el sistema
En sistemas operativos Windows podemos ver todos los sockets del sistema que se encuentran abiertos, simplemente ejecutando el siguiente comando en el símbolo del sistema con permisos de administrador:
netstat
En la siguiente imagen podéis ver el protocolo TCP, la dirección local que está formada por IP:PUERTO y también la dirección remota que está formada por IP:PUERTO. Finalmente, también nos indica el estado de la conexión.
En sistemas operativos Linux también existe el netstat, o mejor dicho, existía, porque ahora se considera «deprecated». El sustituto es el comando «ss» que tiene las mismas funcionalidades pero nos permite más opciones de visualización. Si estás usando un sistema operativo basado en Linux, puedes ejecutar el siguiente comando para ver todos los sockets:
ss
Ahora que ya hemos visto qué es un socket, vamos a ver qué diferencias hay con los puertos.
Componentes del Socket TCP/IP
Dentro del modelo TCP/IP podemos diferenciar diferentes capas, las cuales están destinadas a una función de cara a establecer una comunicación. Se dividen en niveles y están coordinadas entre sí. Estas son:
- Nivel de enlace o acceso: Es la primera capa que nos encontramos, y crea el acceso físico a la red. Esto se realiza especificando el modo en el que se deben enrutar los datos. Esto no se ve afectado por el tipo de red que utilizamos.
- Nivel de red o Internet: Genera los paquetes de datos o datagramas, y se encarga de administrar las direcciones IP. Es considerada la capa más importante ya que cuenta con los protocolos IP, ARP, ICMP, EGMP o RARP.
- Nivel de transporte: Esta capa se encarga de dar a conocer el estado de las transmisiones y los datos de enrutamiento. Para ello da uso de los puertos para realizar una asociación entre una aplicación y los datos.
- Nivel de Aplicación: Es la parte más alta del protocolo TCP/IP, y se encarga de comunicar las aplicaciones con todas las capas anteriores.
En este caso, podemos ver que las capas coinciden con el modelo OSI, pero en este caso las tareas son mucho más variadas. Se trata de un protocolo muy importante, pues permite que los datos que son enviados lleguen a su destino sin que surjan errores, y siempre bajo la misma forma en la que estos fueron enviados, de forma que la información es lo más fiel posible.
Ventajas modelo TCP/IP
Como hemos visto, este modelo se encarga de que la información transcurra correctamente y sin errores, pero tiene otros beneficios los cuales pueden ser desconocidos. Todos contribuyen a una comunicación exacta.
- Es un protocolo capaz de trabajar con una gran gama de hardware, y es soportado por la mayoría de los sistemas operativos.
- Es adecuado para grandes, medianas y pequeñas empresas, así como para redes domésticas.
- Cuenta con gran compatibilidad con herramientas de análisis, monitorización y funcionamiento de las redes.
- Se utiliza a nivel mundial, por lo cual es el más utilizado.
Socket UDP
Además del socket TCP, también está el socket UDP, que viene de ‘User Datagram Protocol’. En cualquier caso, hay que tener claro que este tipo es uno de los dos sockets que se utilizan. Por ejemplo, este tipo necesita que se le entreguen paquetes de datos que el usuario final debe construir. En sí, se manda información a un destino en particular sin que sea necesario realizar una conexión que sea privada. Además de que es mucho más eficiente que el otro tipo en cuestión, aunque con el inconveniente de que no se puede garantizar la fiabilidad.
Por otro lado, los datos que se transfieren se envían en paquetes de información, también conocidos como datagramas, con un tamaño que está limitado. El problema que viene de no garantizarse la entrega o la fiabilidad es que estos paquetes se pueden llegar a duplicar, perder o hasta recibirse en un orden completamente distintos al que se envió en su momento. Por lo que es un aspecto que hay que tener claro de este tipo de socket.
No obstante, presenta una importante ventaja: no tienen casi sobrecarga sobre la información que va a ser transmitida, al igual que los retrasos en este caso son mínimos. Por lo que también presenta una serie de beneficios el uso de este socket en concreto.
Diferencias entre sockets
De primeras, hay que diferenciar entre los sockets de flujo (TCP) y los sockets de datagramas (UDP). Los primeros usan el protocolo TCP con el objetivo de dar una conexión bidireccional y que se garantiza esta entre dos puntos de una red. Por lo tanto, hay que tener claro que los datos se transmiten en secuencia y hay una garantía de que la entrega sea ordenada y, sobre todo, de que no se produzcan errores.
Ahora bien, en cuanto al segundo tipo, en este caso, se usa UDP. Se da una comunicación sin conexión y lo cierto es que no es confiable entre dos puntos en una red. Así que en el caso de los sockets de datagramas, los paquetes que se envían son independientes, por lo que esto lleva a que la transmisión sea más rápida, aunque con el inconveniente de que no se dan ninguna garantía para su entrega ni tampoco en el orden.
Una vez que se tiene en cuenta estos aspectos con respecto a los dos tipos de sockets, hay que tener otro punto clave en cuenta: las garantías de entrega y pedido. Por parte del protocolo TCP, lo cierto es que sí que se garantiza la entrega de los datos y, como veíamos antes, se da un orden en esta. Por lo que se suele usar en la transferencia de archivos y también en la navegación web. En cambio, por parte de UDP, se da mayor importancia a la velocidad y a la eficiencia final, por lo que se deja de lado la garantía de que se vaya a dar la entrega y, además, también se olvida de preocuparse por el orden de entrega de los datos. Por esto mismo, se usa más en la tranmisión de audio y vídeo, y no para otros ámbitos.
Qué diferencia hay con los puertos
A menudo se suele confundir un socket TCP o UDP con los puertos TCP o UDP. Un socket, como hemos dicho antes, está formado por el protocolo de la capa de transporte, la dirección IP de origen y destino, así como los puertos de origen y destino. Los «puertos» solamente es una parte del socket, una parte fundamental pero solamente una parte, para poder formar un socket es necesario contar también con las correspondientes direcciones IP para que pueda haber comunicación punto a punto entre dos procesos.
Cuando nosotros abrimos un puerto en el router, realmente lo que estamos haciendo es permitir una comunicación desde el exterior (Internet) hacia dentro de la red local, atravesando la NAT que todos los routers tienen para el protocolo IPv4. Cuando estamos en un entorno NAT, el router se encargará de traducir las direcciones IP privadas en la pública, con el objetivo de poder enrutar correctamente todo el tráfico a Internet.
En el caso de que cualquier cliente dentro de la NAT desee comunicarse con un servidor web que está en Internet, el socket que creará este cliente local será algo como esto:
- Protocolo: TCP.
- IP origen: 192.168.1.2 (nosotros).
- IP destino: 88.88.88.88 (el servidor web).
- Puerto origen o local: 49152 (nosotros).
- Puerto destino o remoto: 443 (servidor web).
Entonces el router cogerá esta conexión, y la traducirá en lo siguiente, para que pueda ser enrutada a través de Internet, creando un nuevo socket entre el router y el servidor web remoto:
- Protocolo: TCP.
- IP origen: 20.20.20.20 (nuestra IP pública).
- IP destino: 88.88.88.88 (el servidor web).
- Puerto origen o local: 49152 (nosotros).
- Puerto destino o remoto: 443 (servidor web).
En el caso de que la comunicación sea al revés (desde fuera de la NAT hacia dentro de la NAT), es cuando debemos abrir un puerto en nuestro router para que se pueda alcanzar el servidor desde el exterior, de lo contrario, el firewall del router parará toda comunicación.