Logotipo
volta Main Page

MP3 - Lab Audio
Teste de Resolução: MP3, MP3Pro e MP4-AAC
- Marcos Ficarelli (Jan 2011)

Abstrato:

O teste quis comparar várias codificações (codecs) para MP3, usando vários sistemas e bitrates, fixos e variáveis.

Histórico:

O MP3 é uma codificação criada em 1993 pelo MPEG (Moving Picture Experts Group), e desenvolvida por um grupo liderado pelo Fraunhofer Institute, Bell Labs e Thomson. Seu verdadeiro nome é "MPEG-1 Part 3": a parte audio para filmes digitalizados em MPG (também chamada "Layer 3").

O MP3 é:

O codec Fraunhofer usa (ou usava) um filtro low-pass em 14,5kHz (frequência máxima). Alguns reclamam deste "som abafado", que os testes não comprovaram.

Em 1998, Mike Cheng lançou um codificador (Lame) gratuito, depois desenvolvido por Mark Taylor (v.3 - 2003) com grandes melhoras. Hoje é open-source (código aberto)

O MP3Pro, lançado pela Thomson, é um desenvolvimento "compatível", que adiciona ao MP3, uma SBR (spectral band replication) - uma repaginação dos agudos, usada para melhorar a representação dos agudos em bitrates baixos, supostamente causando redução no tamanho dos arquivos. Usa low-pass de 14,5kHz.

O MP4 AAC (advanced audio coding) é o sucessor do MP3, multicanal, estandarizado pelo ISO e IEC. Acima de 128kbit, é considerado "transparente". Desenvolvido pelo Bell Labs, Fraunhofer, Dolby, Sony e Nokia, é muito mais flexível (elástico). No momento, poucos players tocam MP4, mas já é padrão no cinema e em Blu-Ray.

Teste:

O som base usado, foi uma emissão de Pink Noise, Mono, calibrada a OdB em curva K14C, linear, em WAV (resulta uma linha horizontal a -16dB-RMS). Usou-se por ser uma emissão muito completa e complexa, com grandes e rápidas variações de tom e dinâmica. Nota: o Noise usado não é o puro Pink Noise. Alguns o chamam de orange ou browny. O presente noise foi criado por mim mesmo, baseado nas curvas C hoje utilizadas.

A emissão foi codificada em muitos sistemas MP3, usando o programa Nero 10 Ultimate com todos os necessários plugins (oficiais). A medição foi executada (exceto MP4 AAC) tocando-se no Winamp, com plugin Thomson, e fotografada no Spectrum Analyzer SPAN da Voxengo.

As imagens foram capturas "de instante", por isso não possuem traçamento igual - poderiam ter sido por somatória - mas retratam com maior precisão o resultado.

Note-se que, em geral, o bitrate para Mono é equivalente à metade do usado para Stereo. Este fato é importante, porém, no resultado final, demonstrou-se irrelevante

As Imagens:

Para cada teste, foram capturadas 2 imagens:

Codificações:

Entre as várias testadas, por questão de relevância, decidiu-se apresentar somente as de banda ampliada, por considerar-se irrelevante a medição dos graves:

Codec WAV > MP3File Size (kb)%Size (of Wav)Figure
Fraunhofer Fixo 128kBit16218,3
Fraunhofer Variable Highest21924,8
Lame Fixo 56kBit728,1
Lame Fixo 128kBit16218,3
Lame Fixo 192kBit24327,5
Lame Fixo 256kBit32436,7
Lame Variable Quality 0013815,6
Lame Variable Quality 049510,7
Lame Variable Quality 09465,2
MP3Pro Fixo 56kBit728,1
MP3Pro Variable Highest11913,4
MP4 Dolby AAC Variable 169kBit11412,9
MP4 Dolby AAC Variable 400kBit26530,0
WAV882100,0

Resultados Técnicos, mas Práticos:

  1. Bitrate Variável: Em quase todos os casos (exceto acima de 256kbit), usando-se players que identificam (quase todos modernos), a "leitura" é mais completa causando menos "estalos". O corte do filtro low-pass é irrelevante para o ouvido. O som é muito agradável.
  2. Melhor Codec: em MP3, o Lame versão 3 é o melhor em qualquer situação - cristalino; principalmente porque, por ser open-source, continua em desenvolvimento
  3. MP3Pro: Muito bom, não mais justifica seu uso (não é gratuito). O Lame o ultrapassou em tudo (qualidade ou tamanho de arquivo).
  4. MP4: Muito perfeito. A 400kbit (variável), é indetectável do WAV. É o padrão para o futuro
  5. Escolha Final: puramente subjetiva

Resultados Auditivos:

Vejam acima, com calma, o gráfico do Lame Fixo @ 56kbit (chega até 3,9% do original!). Parece dizer que, mesmo em baixíssima resolução, o MP3 consegue reproduzir perfeitamente o audio de entrada?

Uau! A resposta é: quase sim! Usando-se como teste uma boa gravação original, pouco pode-se notar de "artifacts" (defeitos?), em quaisquer dos sistemas e resoluções analisadas.

Após os testes acima, promovi vários outros, auditivos, para tentar provar que eu estava errado. Não consegui. Os resultados foram sempre acima das expectativas.

Considerações:

A criação do MP3 visou compactar as informações de som, tornando-o "portátil". Àquela época, a mídia era o CD (para o MPEG-1 e -2) e a capacidade de armazenamento dos HDs e Cards era limitada. Não é hoje o caso. Por isso, os Codecs usados no início, que compactavam até 12 vezes o tamanho dos arquivos, não têm mais razão de ser (não precisa compactar tanto assim).

Hoje, os Codecs @20% são perfeitos e @30% são indetectáveis tecnicamente, sendo usados nas mais críticas situações.

Final:

Esses Codecs são psicoacústicos, resultado de testes exaustivos em laboratórios. Por meio da execução do programa, traduzem o mais perfeitamente, todos detalhes do audio musical. Não há definição técnica para "o que é" psicoacústico.

O MP3 e MP4 têm uma característica FINAL, visando nunca serem editados futuramente (em troca da redução de tamanho do arquivo).

Mas algo ainda pode ser mexido sem alterar o arquivo: Ambos são arquitetados em "frames", facilitando a criação de frames adicionais, como os da tecnologia ID3v2.3, que permite a inserção de informações importantes aos arquivos (dados, letra, tom etc.), e hoje já podemos encontrar editores que, em certas situações, podem alterar o arquivo de modo "lossless" (ex: MP3Gain altera o volume médio RMS), sem perdas.

Cada vez mais, os programadores dedicam-se a melhorá-los, numa competição que não termina. Por isso, os codificadores são cada vez mais rápidos, mesmo que complexos (e saiba que música produz um arquivo muito complexo).

Existem muitos outros Codecs, sendo alguns "lossless" (ex: TTA - True Audio), com quase o mesmo quociente de compactação dos MPEG. Só não conseguimos a prova de que estes são "melhores" (pois não são puros RAW - a granel).