Fourier: do Youtube ao Netflix

Seja quem for esse tal Fourier ele merece um prêmio, não acha? Afinal, sem ele a nossa amada Netflix de cada dia não existiria! Curioso para saber quem é e o que ele fez de tão importante? Então pausa aí sua série/filme e acompanha o raciocínio aqui.

Jean-Baptiste Joseph Fourier foi um físico e matemático francês do século XVIII. O foco de seus estudos estava em entender o calor e seus mecanismos de propagação. Foi ele, por exemplo, quem, pela primeira vez, falou sobre o efeito estufa e os mecanismos do aquecimento global (o que coloca o presidente Trump no século XVII…) (você pode saber mais sobre o aquecimento global clicando aqui e aqui). E foi justamente estudando a propagação do calor que ele desenvolveu uma ferramenta que, séculos mais tarde, possibilitaria a existência de serviço de stream tipo Netflix, Spotify e Youtube. Essa ferramenta é conhecida como transformada de Fourier.

 

A transformada de Fourier é uma ferramenta matemática que descreve uma onda complexa como a soma de várias ondas simples. Ele a utilizou para descrever o calor, mas serve para qualquer outra onda. Se você nos acompanha, então já sabe do que eu estou falando: do timbre.

Vou tentar explicar com mais detalhes utilizando como exemplo o som. 

Quando uma pessoa fala ela emite uma onda sonora complexa como mostrada na figura 1.

Figura 1: Onda resultante da soma de várias ondas. Imagem gerada pelo simulador “Fourier: Criando Ondas” do PHeT.

Esse tipo de onda é característica de cada fonte sonora, o que significa que nenhuma outra fonte sonora emite uma onda com exatamente o mesmo formato que outra. Essa diferença é o que nos possibilita reconhecer o som de um violino, por exemplo, e diferenciá-lo do som emitido por qualquer outro instrumento musical. Ou ainda, nos permite reconhecer e diferenciar a voz de pessoas conhecidas. Essa característica é conhecida como timbre. Na figura 2 você encontra alguns exemplos de timbres de diferentes fontes sonoras.

Figura 2: Timbre de diferentes fontes sonoras. Perceba que o formato de cada onda é característico de uma fonte sonora específica. Todas essas fontes estão emitindo a mesma frequência (mesma nota).

O que Fourier descobriu é que é possível determinar esses formatos complexos somando diversas ondas simples. Para entender isso direitinho, voltamos a voz da pessoa da figura 1. Quando uma pessoa fala ela emite simultaneamente diversas ondas simples, com diferentes intensidades, que somadas resultam no timbre específico da voz dessa pessoa, como é mostrado na figura 3.

Figura 3: À esquerda na imagem está representada as três primeiras ondas que compõe a onda resultante (onda à direita na imagem). Observe que a onda mais simples formada tem frequência 200 Hz, a próxima 600 Hz, a seguinte 1.000 Hz e assim por diante. O motivo disso ser assim é o tipo de fonte sonora, no caso, uma pessoa falando. Outra coisa que se deve observar é que a onda resultante tem frequência igual ao da onda mais simples. Isso porque essa última tem maior intensidade em relação às outras.

Veja que essas ondas têm frequências cada vez maiores. Superando, facilmente, os 20.000 Hz que é o som mais agudo que um ser humano consegue escutar, na média. O que significa que nós emitimos sons quando falamos que um ser humano não consegue escutar! Até aí tudo bem…

A essa altura você definitivamente deve estar se perguntando: “Ok, mas o que isso tem a ver com a Netflix, meu?”. Calma, sua paciência será recompensada com a revelação de como funciona nossos amados serviços via stream. Antes de revelar isso, é preciso compreender um pouco como é processada informação computacional e como funciona a compartimentação de arquivos digitais.

Bom, quando uma banda grava uma música em um estúdio, os equipamentos de gravação convertem o som dos instrumentos da banda (chamado sinal analógico) em informações computacionais (chamado sinal digital). Quanto melhor for o equipamento de gravação e a resolução escolhida mais perfeitamente o sinal digital se assemelhará ao sinal analógico. Depois de gravado no formato digital, usa-se equipamentos (como alto-falantes) que convertem o sinal digital em analógico novamente. É bom explicar que nesse processo sempre se perde informação. É por isso que escutar a banda ao vivo parece tão diferente!

Antes de continuar a leitura desse artigo, você precisa entender que o sinal analógico (o som dos instrumentos) é composto também por sons acima de 20.000 Hz (conhecidos como ultra sons), portanto, inaudíveis como explicado acima. Entendeu?

Quanto mais informação convertida do sinal analógico, mais informação computacional armazenada. Faz sentido? Portanto, quanto mais complexa a onda sonora for, mais espaço no HD do computador será necessário. Certo? Mas “pera” aí! A banda também emite sons que não são audíveis, mas que são gravados no computador ocupando espaço no HD! Toda essa informação computacional referente aos ultrassons é completamente inútil por dois motivos:

  1. Ninguém vai conseguir escutar e;
  2. A maioria dos alto-falantes não é capaz de reproduzí-los.

Então, já que não vai fazer falta, por que não excluir a informação digital referente a essas frequências? Consciente dessa situação, alguns engenheiros desenvolveram softwares capazes de fazer isso e… Tãn Tãn! Um arquivo de áudio que antes tinha 100 MB, agora tem 3 MB! Nasce o Mp3! Conhece?

O mesmíssimo processo acontece com os arquivos de vídeo e foto. Nossa visão, assim como nossa audição, é bastante limitada. Frequências acima do violeta (ultravioleta) e abaixo do vermelho (infravermelho) são invisíveis para um ser humano, mas registradas na gravação de uma imagem. Desprezar essa informação, assim como feito com o som, permite que os arquivos de vídeo diminuam seus tamanhos em até 90% sem perder qualidade aparente!

Se você quisesse enviar esses arquivos compactados em tempo real (o que serviços de stream fazem) seria necessário internet de altíssima velocidade, que é ainda inacessível para boa parte da população. Para viabilizar esse tipo de serviço há duas soluções:

  1. ou aumentar a velocidade da internet
  2. ou diminuir ainda mais o tamanho dos arquivos.

Enquanto a primeira solução não se torna realidade, os serviços de stream atuais optaram por diminuir ainda mais os arquivos, ignorando frequências audíveis mas muito altas (12.000 Hz, 15.000 Hz…) ou ainda frequências visíveis, mas que não fariam tanta falta (o que depende do tipo de imagem que se quer como resultado). Dessa forma, uma internet com poucos kbps (kilo bites por segundo) é o suficiente para assistir nossas séries favoritas na Netflix ou escutar as melhores músicas no Spotify!

Então, da próxima vez que você gravar sua voz no Whatsapp, lembre-se que ela só é esquisita por conta das transformadas de Fourier que processam e compactam o áudio para que seja possível enviar e receber com o mínimo de consumo de dados possível. Fique tranquilo, pois as outras pessoas não te escutam falar ao vivo desse jeito, ok?

 

O que achou deste artigo? Comente e compartilhe!

 

REFERÊNCIAS

A música digital não existiria sem a transformada de Fourier, por  Jamie Condliffe.

Cerqueira EO, et al. Utilização de filtro de transformada de Fourier para a minimização de ruídos em sinais analíticos. Química Nova, v. 23, n. 5, p. 690-698, 2000. 

Cáceres J, Aditiva S. Transformada de Fourier. 2007.

Gonzaléz RC, Woods RE. Tratamiento digital de imágenes. 1996.

Meirovitch L. Analytical methods in vibrations. New York: Macmillan, 1967.

 

 

Facebook Comments Box
COMPARTILHAR:

3 thoughts on “Fourier: do Youtube ao Netflix

Fechado para comentários.