[an error occurred while processing this directive]
|
Для речи.
Строят/придумывают модель, извиняюсь, глотки человека. Модель имеет некоторые параметры. при кодировании эти параметры в реальном времени подбирают так, что бы выход от модели и то что реально было сгенерированно глоткой как можно меньше отличались (в том или ином смысле). полученные параметры модели передают декодирующей стороне - так как надо передать/сохранить только параметры модели - битрейт мал.
Для любого звука - все гораздо не так :). обычный метод сжатия
- представить сигнал в частотной области (кусочек сигнала)
- поглядеть какие частотные составляюще можно выбросить
- какие можно передавать не полностью
- какие можно квантовать погрубее
исходя из психоакустики человеческого уха
ну и + к этому пытаются так или иначе испольщовать корреляцию - всякие там предсказания/ошибки
далее то что получилось закодировать каким энтропийным кодом.
поэтому важно на что нацелена система на любой звук или на голос.
для голоса - разные вокодеры аля LPC CELP серии G. и mpeg
http://www.data-compression.com/speech.html
для звука - mpeg1-2 layer1-3 mpeg4-AAC Ogg-Vorbis ...
E-mail: info@telesys.ru