A gravação de voz PCM linear (modulação do código de pulso) é um método de gravação de áudio digital que representa diretamente a amplitude de um sinal de áudio analógico como uma sequência de valores numéricos. É a forma mais simples e fundamental de áudio digital. Aqui está um colapso:
*
Linear: A relação entre a amplitude da onda sonora e o valor numérico é linear. Uma duplicação do nível de pressão sonora resulta em uma duplicação do valor numérico. Isso contrasta com métodos como compactação, que alteram essa relação para melhor utilizar a faixa dinâmica disponível.
*
pcm: Este é o método de codificação. A forma de onda de áudio analógica contínua é amostrada em intervalos regulares (medidos em amostras Hertz ou Hz - por segundo). Em cada amostra, a amplitude é medida e convertida em um número digital. Quanto maior a taxa de amostragem, mais precisa a representação digital do som original.
*
gravação de voz: Isso simplesmente especifica o tipo de áudio que está sendo gravado - fala humana.
Características -chave: *
High Fidelity (potencialmente): Com taxa de amostragem suficiente e profundidade de bits (explicada abaixo), o PCM linear pode obter fidelidade muito alta, representando com precisão as nuances da voz.
*
tamanhos de arquivo grandes: Por ser um formato não compactado, os arquivos PCM lineares tendem a ser bastante grandes. Isso ocorre porque cada amostra é representada por vários bits (profundidade de bits).
*
Taxa de amostragem: Taxas de amostragem mais altas (por exemplo, 44,1 kHz, 48 kHz) capturam mais detalhes, resultando em melhor qualidade de som, mas maiores tamanhos de arquivo. Para gravação de voz, taxas de amostragem mais baixas como 8 kHz geralmente são suficientes e resultam em arquivos menores, enquanto ainda preservam o discurso inteligível.
*
Bit profundidade: Isso se refere ao número de bits usados para representar a amplitude de cada amostra. As profundidades de bits mais altas (por exemplo, 16 bits, 24 bits) fornecem uma faixa maior de valores de amplitude, levando a uma faixa dinâmica aprimorada e menor ruído de quantização (uma forma de distorção). Para a voz, 16 bits geralmente é suficiente.
Em resumo, a gravação linear de voz do PCM é uma maneira direta de capturar digitalmente a voz. É fácil de entender e processar, mas sua natureza não compactada leva a tamanhos de arquivo maiores em comparação com formatos compactados como MP3 ou AAC. A escolha da taxa de amostragem e da profundidade do bit depende do equilíbrio desejado entre qualidade e tamanho do arquivo.