Kodowanie mowy w GSM

ITpedia

Analogowe sygnały mowy są przetwarzane na postać cyfrową przez 13-bitowy przetwornik A/C z częstotliwością próbkowania 8 kHz - co przy próbkach 125 s daje szybkość przetwarzania 104 kb/s. Otrzymany strumień podlega segmenetacji (bloki po 20 ms), filtrowaniu i przetwarzaniu w koderze mowy, w wyniku czego otrzymuje się cyfrową postać mowy z pełnokanałową przepływnością FR wynoszącą 13 kb/s (lub co 6,5 kb/s w kodowaniu połówkowym HR). W wyniku kodowania kanałowego ( nadmiarowość informacji) uzyskuje się kanał rozmów GSM o przepływności podstawowej 22,8 kb/s.
Analogowe sygnały mowy są przetwarzane na postać cyfrową przez 13-bitowy przetwornik A/C z częstotliwością próbkowania 8 kHz - co przy próbkach 125 s daje szybkość przetwarzania 104 kb/s. Otrzymany strumień podlega segmenetacji (bloki po 20 ms), filtrowaniu i przetwarzaniu w koderze mowy, w wyniku czego otrzymuje się cyfrową postać mowy z pełnokanałową przepływnością FR wynoszącą 13 kb/s (lub co 6,5 kb/s w kodowaniu połówkowym HR). W wyniku kodowania kanałowego ( nadmiarowość informacji) uzyskuje się kanał rozmów GSM o przepływności podstawowej 22,8 kb/s.

Cyfrowe kodowanie sygnału mowy do podstawowej przepływności 13 kb/s, stosowane w sieciach GSM (faza 1), jest standardowym rozwiązaniem w sieciach drugiej generacji (2G), oznaczanym jako FR (Full Rate). Pomimo pięciokrotnie mniejszej szybkości niż w klasycznym koderze telefonii PCM (64 kb/s) kodowanie FR zapewnia stosunkowo dobrą jakość mowy w kanale rozmównym z kodowaniem kanałowym – o łącznej przepływności 22,8 kb/s, porównywalną z przekazami w analogowej telefonii stacjonarnej.

W celu podwyższenia pojemności sieci GSM opracowano (1990–1995 r.) kodeki połówkowe HR (Half Rate) z kodowaniem do szybkości 5,3 kb/s (i innych), o niewiele gorszej jakości przesyłanych sygnałów mowy. Kodowanie połówkowe nie przyjęło się powszechnie w sieciach GSM (faza 2) ze względu na podwyższony poziom szumów powstających w procesie kodowania i trudności z ich skutecznym eliminowaniem. Może być ono stosowane w razie przeciążenia stacji bazowej nadmierną liczbą połączeń rozmównych, niestety zwykle z pogorszeniem jakości odbioru głosowego.

Zaproponowana w latach 1995–1996 udoskonalona wersja pełnokanałowego kodeka (koder plus dekoder) mowy EFR (Enhanced Full Rate) stanowi usprawnienie dotychczasowej wersji Full Rate, opartej na schemacie kodowania predykcyjnego CELP (Code Exited Linear Predictive Coding). Pomimo osiągania lepszych parametrów (12,2 kb/s), ten sposób kodowania jest bardziej wrażliwy na zmianę jakości sieci, z powodu błędów pochodzących zarówno z kanału, jak i od współpracujących urządzeń. Wybór właściwego sposobu kodowania mowy dokonuje się automatycznie, pod warunkiem, że są one dostępne zarówno w bazowej stacji nadawczo-odbiorczej BTS (Base Transceiver Station), jak i w stacjach ruchomych (MS – Mobile Station).

Nowszym sposobem kompresji zakodowanych sygnałów mowy jest metoda adaptacyjna, za pomocą kodeka AMR (Adaptive Multi-Rate Codec), stosowana globalnie w systemach trzeciej generacji, a także w UMTS (Europa). Kodek AMR może operować w dwóch standardach: FR i HR, a w każdym z nich może działać kilka trybów kompresji sygnału głosowego z różną szybkością kodowania. Dzięki wbudowanym mechanizmom nawet kilkukrotnej zmiany trybów pracy w ciągu jednej sekundy adaptacyjne dostosowanie się kodeka do rzeczywistych warunków kanału informacyjnego staje się możliwe i stanowi największą zaletę tego sposobu kodowania. Szeroki zakres zmian szybkości kodowania mowy (od 4,5 do 14 kb/s) jest nadzwyczaj korzystną cechą kodeków AMR, zapewniającą dużą pojemność systemu w dobrych warunkach transmisji sygnałów radiowych oraz automatyczne utrzymanie wysokiej jakości (kosztem zmniejszenia pojemności sieci) w gorszych warunkach pracy.

Podstawowe szybkości kodowania mowy
Typ kodeka Przepływność binarna (kb/s) zakodowanego sygnału mowy (kompresja)
FR (Full Rate) 13
EFR (Enhanced Full Rate) 12,2
HR (Half Rate) 5,6
AMR (Adaptive Multi-Rate) 2 lub 3, lub 4 szybkości na kanał, co oznacza:
  • adaptację przepływności od 4,5 do 8 dla Half Rate
  • adaptację przepływnośći od 6,5 do 14 dla Full Rate
-
-