Coraz częściej seanse wideokonferencyjne prowadzi się nie tylko w sieciach cyfrowych ISDN, ale także przez sieci komputerowe LAN i MAN, a także przez rozległe sieci (WAN) – przy użyciu protokołów IP. Zwłaszcza przekazy wideokonferencyjne przez Internet, także w intranetowych sieciach korporacyjnych, wymagają zachowania odpowiedniej jakości usług (QoS) oraz gwarantowanej szerokości pasma transmisji.
Sieci z protokołem IP zasadniczo różnią się od ISDN. Przede wszystkim mają one rozproszoną, elastyczną i zwykle rozległą strukturę, która spina różne sieci lokalne (LAN), rozległe (WAN) i/lub sieć Internet. Ich nieodłączny atrybut – skalowanie – umożliwia w zasadzie rozszerzanie pasma transmisji według potrzeb, przez instalację nowego wyposażenia i nowych usług, bez dokonywania fundamentalnych zmian w infrastrukturze sieci. Dzięki temu, w miarę osiąganego postępu w technologiach przekazu, można stopniowo rozszerzać pasmo, aż do osiągnięcia odpowiednich parametrów wymaganych dla jednoczesnej transmisji głosu, obrazu i danych w czasie rzeczywistym.
Obecnie nie wszystkie z istniejących sieci z protokołem IP gwarantują wymaganą szerokość pasma i jakość usługi. Do tego celu są przydatne jedynie takie sieci IP, które na poziomie warstw fizycznej i łącza danych (odpowiadających za jakość usługi) oraz na poziomie warstwy sieciowej (szerokość pasma) zapewniają niezbędne warunki do prowadzenia wideokonferencji. Do tych technologii przekazu należy zaliczyć: przełączany Ethernet (przepływność 10 Mb/s), Fast Ethernet (100 Mb/s), Gigabit Ethernet (1 Gb/s) oraz IP/ATM (IP over ATM), o przepływności nie mniejszej niż 25 Mb/s. Te technologie, a zwłaszcza IP/ATM, już teraz zapewniają wystarczającą jakość i szerokość pasma dla wielostanowiskowych usług wideokonferencyjnych.
Uzyskanie transmisji w czasie rzeczywistym wymaga utrzymania parametrów QoS we wszystkich ogniwach transmisyjnych uczestniczących w procesie przekazu „od końca do końca” – co wcale nie jest łatwe. Nie ma obecnie przeszkód, aby seanse wideokonferencyjne prowadzić przez globalną sieć Internet (działającą z protokołami IP), jednakże zadowalającą jakość takich przekazów będzie można uzyskać dopiero po zapewnieniu odpowiedniego skalowania we wszystkich jej ogniwach pośrednich – czyli po zapewnieniu odpowiedniej szerokości pasma transmisji. Heterogeniczność sieci Internet i jej stosunkowo niewielka przewidywalność zachowań nadal utrudniają utrzymanie parametrów czasu rzeczywistego, chociaż sieci IP wykonane w technologii IP/ATM zapewniają – co wynika z samej istoty ATM – odpowiednią QoS, wymaganą szerokość pasma i izochroniczność usług. Zwłaszcza jeśli do zapewnienia odpowiednich zasobów na potrzeby konferencji (głosowych bądź obrazowych) w sieciach IP korzysta się z protokołów czasu rzeczywistego RSVP (Resource Reservation Protocol) czy IP multicast.
Zaproponowany przez ITU (1996 r.) standard H.323 był przeznaczony początkowo jedynie do obsługi telekonferencji w sieciach ISDN. Został on rozszerzony o komunikację czasu rzeczywistego przez sieci pakietowe z protokołem IP i jest obecnie szeroko stosowany jako podstawowy standard wideokonferencyjny środowiska IP. Protokół ten jest stopniowo wypierany przez nowszy, bardziej sprawny protokół sygnalizacyjny SIP (Session Initiation Protocol) – wprowadzony przez IETF (Internet Engineering Task Force) głównie z przeznaczeniem do obsługi VoIP.
Od niedawna wykorzystuje się komplementarne w stosunku do poprzednich protokołów H.323 i SIP dwa najnowsze rozwiązania komunikacyjne: opracowany przez IETF protokół MGCP (Media Gateway Control Protocol) oraz MEGACO/H.248 (IETF razem z ITU), przeznaczone do sygnalizacji między sterownikami sieci pakietowej a bramami dostępowymi MGW (Media Gateway) tej sieci. Stanowią one kluczową pozycję w dalszym rozwijaniu usług wideokonferencyjnych przez sieci pakietowe IP, zapewniając realizację tych połączeń „od końca do końca”, między dowolnymi typami terminali wideokonferencyjnych i urządzeniami końcowych sieci następnej generacji NGN (Next Generation Network).