Le poids d'un fichier son est tributaire :
De sa complexité / finesse, soit :
de la fréquence d'acquisition,
ou encore du nombre d'échantillons considérés par seconde. Pour les
non-initiés, il faut comprendre le nombre de fois, par secondes, où l'on
va prélever un instantané du son produit pour le coder, et le placer
après l'échantillon prélevé juste avant. Pour les autres, on parle ici
de la fréquence d'échantillonnage choisie pour numériser le son à
coder. On remarquera que la fréquence d'échantillonnage est placée à
44.1 kHz, qui donne un spectre rendu théorique jusqu'à 22 kHz (Cf
Shannon). Sachant que l'oreille discerne péniblement des fréquences
au-dessus de 15 à 17 kHz...
de la profondeur de codage
utilisé (16 bits) qui permet d'affiner la numérisation du signal
analogique, en sa valeur la plus proche à la précision près
conditionnée par le nombre de bits utilisé. Encore une fois, pour les
non-initiés, lorsque l'on prend un instantané du son 44100 fois par
seconde, encore faut-il posséder suffisamment de finesse dans son codage,
pour pouvoir restituer le son initial de la façon la plus fidèle.
du format stéréo ou mono de la
piste.
* Picture
Element
Du codage utilisé pour compresser
les données. (Le bien connu MP3 !!)
De sa durée (!).
Par définition :
Taille d'un fichier son = ( Résolution) x (Nombre d'échantillons / seconde) x (durée).
Résolution
Couramment, on trouve une résolution de 16 Bits, soit 65 536 niveaux différents. C'est le cas du CD Rom audio ou du fichier .wav, standard sur PC.
Fréquence d'échantillonnage
44,1 kHz, soit encore 44100 fois par seconde
Stéréo ou mono
Passer de mono à stéréo double systématiquement la taille du fichier audio. On pourra remarquer que pour une utilisation à travers Internet ou un média à débit limité, il est souvent beaucoup plus avantageux de privilégier, à même taille de fichier, la fréquence d'échantillonnage, plutôt que la stéréophonie du signal initial. L'idéal est bien sûr de conserver les 2 paramètres au plus haut...
Compression
Les progrès techniques ont permis d'accoucher de machines suffisamment performantes, qui peuvent pratiquer des quantités incroyables d'opérations par seconde. Il est donc devenu possible, une fois le fichier traditionnel obtenu (.wav), de compresser celui-ci en utilisant des algorithmes complexes (généralement d'ailleurs plus à la création, qu'à la lecture), de façon à réduire la taille résultante du fichier informatique, qui pouvait être décodé parallèlement à la lecture du fichier son, sans créer d'artefacts dans la qualité de restitution sonore. De façon très schématique, le processeur employé doit, dans l'intervalle de 22 µs (44100 fois par seconde) entre 2 échantillons sonores, décoder l'échantillon suivant pour être capable de le fournir en temps et en heure.
Qualité CD non compressé :
Un échantillonnage à 44.1 kHz, sur 16 Bits, Stéréo, typique d'un CD Rom ou d'un fichier .wav de 1 seconde donne :
[44100]fréq. x [16 Bits]résol. x [2]stéréo
= 1 411 200 bits
= 176 400 octets
On donne donc habituellement les débits suivants :
Fichier son qualité CD non compressé : 172 ko/s, ou encore 1 378 kbits/s
Conclusion :
On peut mesurer immédiatement des derniers chiffres l'efficacité du codage MP3, qui à qualité quasi égale donne des taux de 128 kbits/s au lieu de 1 378 kbits/s, soit des coefficients de réduction de taille de l'ordre de 10 à 12x.