O MP3 atinge seu tamanho menor de arquivo em comparação com formatos de áudio não compactados como WAV ou AIFF através de um processo chamado
compressão com perdas . Isso significa que ele descarta alguns dados de áudio considerados menos importantes para o ouvido humano. Aqui está um detalhamento das principais técnicas:
1.
Modelo Psicoacústico: Este é o núcleo da compactação MP3. É baseado em como o ouvido humano percebe o som. O codificador analisa o sinal de áudio e identifica frequências e sons que provavelmente serão mascarados por sons mais altos ou são menos perceptíveis à nossa audição. Essas frequências mascaradas são então fortemente compactadas ou descartadas completamente. Por exemplo, um som silencioso de alta frequência tocado simultaneamente com um som alto de baixa frequência pode ser completamente inaudível, por isso é removido.
2.
Transformação de frequência: O sinal de áudio é transformado do domínio do tempo (amplitude ao longo do tempo) para o domínio da frequência (amplitude de diferentes frequências). Isso geralmente é feito usando uma transformação de cosseno discreto modificado (MDCT). Essa representação permite uma identificação e manipulação mais fácil de frequências individuais.
3.
quantização: Após a análise de frequência, os valores de amplitude de cada componente de frequência são quantizados. Isso significa que eles são arredondados para um número limitado de valores. Isso introduz alguma perda de informação, mas como as frequências menos importantes foram identificadas e potencialmente removidas ou fortemente comprimidas, o impacto audível é minimizado.
4.
Codificação de Huffman: Finalmente, os dados quantizados são codificados usando um código de comprimento variável chamado Huffman Coding. Isso atribui códigos mais curtos a dados mais frequentes e códigos mais longos a dados menos frequentes, levando a uma redução de dados adicional.
Em essência, o MP3 aproveita as imperfeições e limitações da audição humana para reduzir significativamente a quantidade de dados necessários para representar o áudio, enquanto pretende manter a qualidade de áudio aceitável. O nível de compactação (e, portanto, a redução de tamanho) pode ser ajustada, resultando em diferentes tamanhos de arquivo e níveis variados de qualidade de áudio. Taxas de compressão mais altas levam a arquivos menores, mas artefatos potencialmente mais visíveis ou perda de fidelidade.