Page 1 sur 2

Réduction de taille des fichiers audio?

Publié : 07 août 2003, 22:05
par Admin
Je rapporte ici une question de Didier posée en e-mail:
bonjour
Pour réduire la taille d'in fichier audio, qu'est-il préférable de
diminuer :
l'échantillonnage (sample) ou la profondeur de bit (bit depth) ?
Merci
Bye.

Publié : 08 août 2003, 00:47
par kilfir
Tout dépend des données de départ.

Je ne suis pas expert de la question mais voici ma recommandation.

Si c'est en 24 bits/48, je réduirais tout d'abord de 48 à 44,1 pour obtenir du 24bits/44,1. Par la suite, je passerais de 24 bits/44,1 à 16 bits/44,1. S'il faut réduire encore, j'irai à 16 bits/22. Et ainsi de suite. Bref, presqu'un principe d'alternance.

Il faut également considérer le logiciel utilisé pour exécuter cette réduction. Il y a des réductions - au départ théoriquement comparabless - plus réductrices que d'autres. Un peu comme pour les convertisseurs D/A.

Publié : 08 août 2003, 08:33
par cluster
Sur Cubase SX ou Wavelab (et sur d'autres comme par exemple samplitude) on utilise une fonction de dithering qui permet de gérer au mieux la perte d'information résultant de la diminution de la valeur de l'achantillonnage et de sa profondeur (pour réduire la taille de fichier de façon logique, il convient effectivement de réduire en parallèle ces deux valeurs)

Publié : 08 août 2003, 12:50
par Didier
Bonjour
Je précise ma question sur la réduction de taille de fichier audio. Il s'agit de conférence, et donc uniquement du texte parlé (et non chanté). Est-il préférable de diminuer l'échantillonnage, et jusqu'à quelle valeur, sans trop nuire à la qualité, ou passer à une profondeur de 8 bits ?

Merci
Didier

Publié : 08 août 2003, 13:06
par Admin
Pour réduire la taille d'in fichier audio, qu'est-il préférable de diminuer l'échantillonnage (sample) ou la profondeur de bit (bit depth) ?
Ca dépend vraiment du type de son contenu dans le fichier audio...
Exemple, si les signaux ont peu de dynamique, le dithering 24 bit vers 16, voir 12 peut ne pas être trop perceptible.
Autre exemple, un signal riche en harmonique (style un morceau de classique) supportera mal la diminution de fréquence...
Donc ca dépend du son.

Pour du speak homme, je dirai que le mieux est du mono 16 bit 22,05kHz. Pour du speak femme, mono 16 bit 44.1. Le 8 bit est en général assez crado, dans mon expérience.

Mais pourquoi ne pas utiliser du MP3, du OGG, ou de l'AAC?

A savoir aussi qu'il existe des compressions non destructives (uLaw, IMA, etc.) pour l'AIFF, qui permette de diviser la taille de 2 à 4, sans pertes, donc.

Bye.

Publié : 08 août 2003, 13:09
par cluster
Je pense également que le MP3 pourrait être une bonne solution. Tout dépend évidemment du support de diffusion

Publié : 12 août 2003, 12:03
par Admin
Damned, on a perdu Didier :) .
Espérons qu'il a trouvé chaussure à son pied?

Petite précision pour le MP3, AMHA, je réglerai le codec comme suit:

homme: mono 16 bit 44.1kHz 64 kbps
femme: idem

Tu peux même descendre à 32kbps, mais faut écouter le résultat qui est assez variable. Voir 16 (c'est ce que je prend pour archiver les interviews que fait ma petite femme ;) . Ca reste intelligible, et comme le son est armoire dés la prise de son :) .

Sinon le format OGG est pas mal non plus (même perfs grosso modo), et à l'avantage d'être opensource, libre quoi, si jamais tu voulais diffuser tes encodages, voir les vendre... L'ogg est lisible sur pratiquement toute les plateformes maintenant.

Hope this helps.

Bye.

Publié : 22 août 2003, 00:02
par theone
perso, et si c'est de la parole, je veux bien toucher à la Fech (dscendre à 32, 22 kHz maxi), pas à la quantif.

sinon, le mp3 est un très bon compromis. la décision doit dépendre du support d'archivage et de relecture au besoin. le cd est tellement pratique et peu cher, qu'archiver à 16b/44k est une solution aussi simple qu'appréciable.

Publié : 12 sept. 2003, 00:30
par pidji
16 bits/22 kHz mono of course

d'accord avec presque tout le monde, ne jammais toucher à la quantification, ça c'est sûr. déjà que 16 bits, c'est pas le pied !

sinon, pour résoudre ce pbm, je me pose la question de savoir ce que je "veux garder", quelle est la fréquence max utile : genre : voix -> 11 KhZ largement suffisant, donc échantillonage à 22. c'est mathématique.

quant à la compression, si l'on veux économiser plus de place que du pur 16/22 mono : MP3, a-ton vraiment le choix ? 64 Kbits, pas en dessous.

j'en profite pour poser une question : autant grâce à Nquyst et Shannon, on sait qu'il faut échantilloner au double de la fréquence, mais en ce qui concerne le débit d'une compression, comment savoir avant d'écouter le massacre, que l'on a le débit optimum en qualité/poids ?

vive les maths.

Publié : 13 sept. 2003, 12:26
par Admin
pidji a écrit :j'en profite pour poser une question : autant grâce à Nquyst et Shannon, on sait qu'il faut échantilloner au double de la fréquence, mais en ce qui concerne le débit d'une compression, comment savoir avant d'écouter le massacre, que l'on a le débit optimum en qualité/poids ?
Ca c'est une bonne question, mais ça me parait difficile d'y répondre dans la mesure ou chaque algorythme de compression réagira différemment. Exemple entre AAC (MPEG4) et MPEG1layer3 (MP3), à débit égal, l'AAC est meilleur...
Je crois qu'on est obligé de tatonner, en essaillant plusieurs réglages, et en se fiant à ses oreilles quant aux résultats.
Un matheux dans la salle pour approfondir cette idée?

Et bienvenue parmi nous Pidji ;-) .

Bye.