Протоколы сжатия звука, применяемые в видеоконференциях
Как и любой другой поток данных, передаваемых по информационным сетям, звуковой сигнал, также, требует компрессии для уменьшения нагрузки на цифровые сети.
Основная идея всех алгоритмов сжатия звука – преобразование исходного аудио-сигнала в форму удобную для передачи по сети, затем, восстановление сжатого потока до исходной формы сигнала.
Естественно, после этих процедур, исходный звук тем больше теряет в качестве, чем сильнее степень компрессии. В результате, идет постоянная борьба за компромисс между удобством передачи аудиоданных и конечным качеством звука. Чтобы, как минимум, обеспечить приемлемую слышимость и разборчивость, необходимую в телефонии. Или, получить максимальное качество речи и музыки, как в видеоконференцсвязи.
Ниже представлен краткий обзор основных аудио протоколов.
G.711 – стандарт сжатия звука разработанный в 1972 году, предназначенный для телефонии, работающий с частотой 8 бит/кадр, при 8000 кадров/секунду, (кадр – это один элемент дискредитации звукового сигнала, т. е. некий прямоугольник на графике ступенчатой оцифровки сигнала) создавая поток передачи данных 64 кбит/с.
G.722 – широкополосный стандарт сжатия звука, принятый в 1988 году и создающий поток 48, 56 и 64 кбит/с.
G.722.1 – стандарт 1999 года, разработанный компанией Polycom по технологии Siren (Siren 7), обеспечивает передачу звука хорошего качества - 50 Гц – 7 кГц, при скорости потока 16, 24 или 32 кбит/с.
G.722.1 Annex C – также, является разработкой компании Polycom по технологии Siren14, с еще большим частотным диапазоном – до 14 кГц, при скорости потока 24, 32, 48 кбит/с в моно режиме и 48, 64 и 96 кбит/с при стерео режиме.
Siren 22 – следующая технология Polycom, обеспечивающая передачу звука с частотой до 22 кГц со скоростью передачи данных 32, 48, 64 кбит/с в моно режиме и 64, 96 и 128 кбит/с при стерео режиме.
G.722.2 – стандарт сжатия (кодек) 2002 года, Adaptive Multi Rate – WideBand – обеспечивает адаптацию скорости сжатия потока в зависимости от фактической пропускной способности линии, при скорости передачи данных от 6.6 до 23.85 кбит/с. Причем, большие значения предназначены для передачи речи и музыки и для конференций с большим количеством участников.
G.723 – устаревший стандарт кодирования речи с диапазоном 300 Гц – 3400 кГц, на скоростях 24 и 40 кбит/с. Сейчас этот стандарт заменен более новым кодеком G.726.
G.726 – кодек для передачи голоса с адаптивной импульсно-кодовой модуляцией (ADPCM), используется на международных телефонных линиях и в некоторых IP-видеокамерах, на скоростях 16, 24, 32 и 40 кбит/с.
G.729 – стандарт узкополосного речевого кодирования от 300 до 3400 Гц, при скорости передачи данных 8 кбит/с. Используется для передачи большого количества телефонных разговоров по Интернет сетям (Voice over Internet Protocol), при ограниченной полосе пропускания. Существует большое количество модификаций данного кодека, с буквенными индексами G.729А и тому подобными обозначениями, созданных для определенных конкретных целей.