Quelle qualité mes sons doivent-ils être?

33

Le son et sa qualité s'apparentent à la religion. Histoire sans fin.

Les gens vont dire que MP3 320kbps est sans perte, alors que les experts diront que tout MP3 est de la merde, mais à la fin, personne n'entendra le résultat différent ... à moins d'être dans l'industrie de la musique depuis plus de 20 ans.

Quel serait le meilleur format pour le jeu vidéo, et quelles propriétés devraient être suffisantes (Hertz, débit, etc.), en supposant que le MP3 à 320 kbps est "lourd"?

Peut-être un exemple ou deux, comment certains titres AAA fonctionnent avec leurs sons.

Joltmode
la source
3
Les experts qui entendent la différence entre un MP3 de 320 kbps et un enregistrement sans perte disposent généralement d’une installation hi-fi (très) coûteuse qui leur permet même d’entendre ces différences. Pas quelque chose que vous avez sur votre PC ou appareil mobile habituel. De plus, jouer à un jeu est différent d’écouter de la musique. Votre cerveau est occupé à autre chose que de penser à une qualité audio inférieure à la normale;)
bummzack
2
@ bummzack, oui, tant que la qualité audio n'est pas si mauvaise qu'elle gêne. Parfois, je trouve des jeux qui ont des effets sonores vraiment médiocres, qui sifflent ou qui sont très compressés. Cependant, mettre presque n'importe quelle considération en qualité audio évitera probablement cela. Je suggère que vous testiez vos échantillons sur quelque chose avec l'audio haut de gamme. Votre codage audio n'est pas le seul facteur conduisant à une bonne qualité audio.
user606723
La seule raison pour laquelle je suis contre MP3, c'est parce qu'il tourne terriblement en boucle.
Sidar

Réponses:

63

Mise à jour juillet 2017

Si vous utilisez Unity ou un autre gros moteur doté d'un système de gestion des ressources, ne demandez pas à Ogg Vorbis à vos concepteurs sonores et à vos compositeurs. Obtenez des WAV ou des AIFF.

Unity et Unreal sont structurés pour fonctionner avec des rebonds de haute qualité, puis appliquent des paramètres de compression par plate-forme. Avoir la ressource source au format Ogg ou Mp3 signifie que vous effectuez une double compression audio et que vous introduisez des artefacts supplémentaires sans aucun avantage.

Si vous voyez que partir d'ogg ou de mp3 réduit la taille de votre build, ce n'est pas une bonne raison. Cela signifie probablement que vous effectuez une pré-exportation avec des paramètres de compression différents de ceux que vous avez appliqués dans Unity / Unreal. Y a-t-il des exceptions? Oui, mais vous ne rechercheriez pas cette réponse si vous saviez à quel moment ces exceptions étaient applicables.

Si vous pré-compressez afin de réduire la taille de votre référentiel, utilisez LFS, utilisez un système de contrôle de version centralisé ou souriez et supportez-le.


TL; DR

  1. Oui , MP3 320k sonne bien. MAIS . . .
  2. N'utilisez pas de MP3, utilisez Ogg Vorbis à 44,1 kHz, qualité 6 pour la musique. Pour les effets sonores, utilisez simplement 16 / 44.1 WAV, sauf si vous sentez que vous avez vraiment besoin de couper le gras.
  3. Si vous devez utiliser des fichiers MP3, tels que Flash, essayez d’utiliser 192k-256k (VBR 1 ou 2), mais vous devrez peut-être vous contenter de 128k. Ne descendez pas plus bas que 128k (VBR 6).

La vraie réponse

Les gens vont dire que MP3 320kbps est sans perte, alors que les experts diront que tout MP3 est de la merde, mais à la fin, personne n'entendra le résultat différent ... à moins d'être dans l'industrie de la musique depuis plus de 20 ans.

L’audio encodé au format MP3, quelle que soit la qualité de l’encodage, entraîne toujours des pertes. C'est un codec perceptuel, et fonctionne donc en codant les propriétés du son dans le temps en ~ 1152 morceaux sous forme compressée, à partir desquels des échantillons non compressés peuvent être extrapolés par le décodeur. Son objectif n'est pas de recréer avec précision l'audio d'origine, mais de fournir celui qui est "assez bon".

Cependant, comme vous l'avez dit, 320 kbps semble très bien. Il est généralement considéré comme aussi bon ou meilleur que la qualité d'un CD. Cependant, il n’est toujours pas possible de recréer parfaitement les échantillons originaux d’un fichier WAV non compressé codé au format MP3 à 320 kbps.

En général, Ogg Vorbis est un meilleur format que le MP3. Il est généralement admis que vous obtiendrez une meilleure qualité pour un fichier de même taille. Contrairement au format MP3, vous pouvez le lire en boucle de manière transparente. Les morceaux de 1152 échantillons que MP3 utilise pour coder l'audio laisseront souvent le silence au début et à la fin du son. Pas un si gros problème pour les effets sonores de base, mais un problème énorme pour les boucles de musique.

L'IDE Flash contourne cela lors de l'exportation .swf, il supprime le silence manuellement. Les personnes qui utilisent le streaming audio (ou le pur mxmlc) réalisent une boucle via SampleDataEvent et déposent manuellement des échantillons ou prétraitent le fichier MP3 (voir le blog de Andre Michelle et l' utilitaire CompuPhase mp3loop ).

En outre, l’utilisation d’un décodeur MP3 nécessite techniquement l’acquisition d’une licence de brevet (le brevet MP3 étant la propriété de Technicolor, Fraunhofer, etc.). De toute évidence, de nombreuses personnes ont publié des jeux gratuits utilisant le format MP3, mais il est préférable de ne pas jouer avec.

Quel serait le meilleur format pour le jeu vidéo, et quelles propriétés devraient être suffisantes (Hertz, débit, etc.), en supposant que le MP3 à 320 kbps est "lourd"?

Peut-être un exemple ou deux, comment certains titres AAA fonctionnent avec leurs sons.

Cela dépend: quelles sont vos plateformes cibles, quelles autres technologies utilisez-vous, comment distribuez-vous votre jeu et quel style voulez-vous? Je vais diviser cela en quelques catégories basées sur la plateforme, la technologie et l'esthétique.

Titres PC et console haut de gamme

Les jeux AAA recherchent une qualité de production haut de gamme. Ils enregistrent et produisent ainsi des ressources 24 bits / 48 kHz non compressées (également la norme en matière de postproduction de films). Les titres avec des ambitions légèrement inférieures à celles de Battlefield 3 pourraient être enregistrés et produits en 16 / 44.1, qui est la norme officielle pour l’audio de qualité CD.

Bien sûr, vous ne pouvez pas envoyer un groupe de 24/48 WAV non compressés avec un jeu, ce serait trop gros. Donc, en fin de compte, il doit y avoir une sorte de compression. En règle générale, s’il s’agit d’un effet sonore rapide comme un son de pistolet (comme le pistolet Portal 2 dans la réponse de Sprunth), il n’est pas inutile de le laisser comme un WAV, ce qui pourrait éventuellement réduire la fréquence d’échantillonnage en fonction de la fréquence (voir le paragraphe 1). Théorème de Nyquist , les sons composés d’un contenu basse fréquence peuvent être codés à des taux d’échantillonnage plus bas). Pour la musique, il n'y a vraiment pas moyen de contourner la compression. Ogg Vorbis en qualité CD est la solution (44,1 kHz, qualité 5-6 ou supérieure).

De plus, les jeux AAA utilisent souvent un outil intermédiaire pour la compression, soit un outil interne, soit un middleware audio tel que FMOD ou Wwise. La façon dont cela fonctionne dans FMOD et Wwise est que vous importez la plupart des choses sous forme de WAV 16 / 44.1 ou 24/48 (ou, si le son est tout contenu basse fréquence, il peut être importé avec un taux d'échantillonnage inférieur), puis donnez FMOD un facteur de compression pour chaque actif, en choisissant un encodage tel que ADPCM, MP3 ou Ogg Vorbis.

En fait, FMOD a récemment abandonné la prise en charge de l’encodage d’actifs dans les banques de sons que vous exportez depuis FMOD Designer (fichiers .fsb) au format Ogg Vorbis au profit d’un nouveau codec de Xiph appelé CELT . Ogg Vorbis peut être un peu dur pour le processeur, CELT est donc en cours de développement pour fournir une alternative. Vous pouvez charger les fichiers directement, mais ne plus les utiliser pour l’encodage à partir de l’application Designer.

À propos, voici un lien intéressant sur l'audio de Battlefield Bad Company qui entre également un peu en surround. DICE est à la pointe de la technologie audio dans les jeux. C'est donc une bonne série à étudier.

En outre, l’enjeu est lié au problème mono vs stéréo. Juste au cas où vous ne le sauriez pas, tous vos effets sonores devraient être mono, à moins que certains d'entre eux utilisent des effets de panoramique. Stereo est difficile à spatialiser dans un environnement 3D et vous pouvez effectuer un panoramique des sons dans le code pour les placer dans un environnement 2D.

Titres Légèrement Moins Hauts, Jeux indépendants

Évidemment, cela peut varier considérablement. Un rapide coup d'œil montre que Frozen Synapse utilise entièrement des fichiers Ogg Vorbis, pour les effets sonores et la musique. Dungeons of Dredmor, quant à lui, suit le schéma d’Ogg Vorbis pour la musique et de 16/44,1 WAV pour les effets sonores.

L’approche Donjons de Dredmor est préférable. Même stockés sous forme de fichiers WAV non compressés, les effets sonores sont généralement suffisamment courts pour ne pas occuper beaucoup d’espace et vous évitez de perdre beaucoup de cycles de la CPU. Vous voulez pouvoir charger rapidement un effet sonore dans la mémoire et le jouer. Si vous encodez vos effets sonores dans Ogg Vorbis, il se peut qu’un peu de retard se produise avant que le joueur n’entende votre effet sonore pour la première fois.

Jeux par navigateur, HTML5 et Flash (avec une touche de mobile)

Le son HTML5 est un gâchis. Vous devez fournir les versions ogg et MP3 de vos sons. Encodez dans la plus haute qualité possible sans que votre utilisateur ne fasse rage avec un temps de chargement long. Pour le MP3, ne descendez pas en dessous de 128k, c’est déjà assez mauvais en 128.

Flash accepte uniquement les formats MP3 16 bits / 44,1 kHz, à moins que vous ne deveniez fou et que vous n'écriviez votre propre décodeur que pour un autre format (comme le décodeur expérimental Ogg Vorbis des laboratoires Alchemy). Dans le passé, Flash avait des problèmes avec les MP3 à débit binaire variable, mais je n'ai jamais eu de problème. Le paramètre de qualité que vous choisissez pour votre jeu Flash dépend de la taille de votre fichier .swf final.

Mise à jour: Comme Tetrad l’a mentionné , les jeux mobiles doivent être considérés avec mémoire et stockage. La manière dont vous encodez votre audio pour les jeux sur mobile ressemble beaucoup à Flash. Vous souhaitez conserver une qualité optimale, mais vous devez au final respecter un budget de mémoire et de stockage. Tracker music est particulièrement utile si votre budget de stockage est limité. Dites à votre compositeur de limiter sa palette d'échantillons et vous pouvez adapter une tonne de musique supplémentaire dans le jeu.

Effets sonores et musique de type "8 bits" ou de type Chiptune

La plupart des jeux ne font que faire ce que Frozen Synapse et Dungeons of Dredmor font. Cependant, vous pouvez probablement vous en tirer en réduisant le taux d'échantillonnage et la profondeur de bits. Cela pourrait non seulement correspondre à l'esthétique que vous recherchez, mais également économiser de l'espace.

En outre, la musique de tracker stocke généralement des échantillons à des taux d'échantillonnage faibles, laissez-les simplement arriver.

michael.bartnett
la source
Effets sonores expliqués. Période.
Joltmode
1
Avez-vous un lien pour l'affirmation selon laquelle les FMOD abandonnent le support d'Ogg Vorbis?
Kylotan
1
Je devrais préciser, ils n'ont pas abandonné tout soutien pour Ogg Vorbis. Il n'est tout simplement plus disponible lors de la sélection d'un codec pour les ressources dans FMOD Designer (réponse mise à jour pour refléter cela). Ils n'ont pas fait de grandes annonces à ce sujet. J'ai découvert quand je suis allé essayer de coder de la musique dans une banque de sons sous le nom d'Ogg Vorbis. Le message de KVR le mentionne: kvraudio.com/news/… Mais vous pouvez tout aussi bien télécharger FMOD Designer et voir par vous-même.
michael.bartnett
1
@emddudley Si votre source audio est quelque chose de taré comme 48 bits / 196 kHz, vous pourriez peut-être la compresser de manière à conserver une quantité insensée d'informations de fréquence et d'amplitude et, en tant que telle, une fidélité supérieure à celle d'un CD audio, qui est fixée à 16 bits / 44,1 kHz.
michael.bartnett
1
@DavidDimalanta WAV est généralement beaucoup plus volumineux que le MP3, mais avec l’avantage de ne pas le décoder, il suffit de le mémoriser. La musique de fond est généralement compressée pour cette raison, car l'audio stocké devient plus long, la taille s'additionne rapidement. MP3 a des problèmes de licence et de boucle transparente, comme je l’ai mentionné dans la réponse, il est donc préférable de l’éviter si vous le pouvez.
michael.bartnett
14

Comment l'industrie fonctionne avec le son, je ne suis pas sûr.

Mais en regardant à travers mes jeux, la plupart d’entre eux l’enveloppent dans un fichier de données ou autre.

Voici quelques extraits audio que je pourrais extraire:

  • Deus Ex: Human Revolution (Menu principal [chanson]) mp3 44100Hz 320kb / s
  • Portal 2 (4000 Degrés Kelvin [chanson]) mp3 44100Hz 128kb / s
  • Portal 2 (Portal Gun fizzle [soundfx]) wav 44100Hz 16bits / échantillon
  • Facteurs de risque ("NORMALLOOP_SEGMENT03" [soundfx]) ogg 48000Hz 128kb / s
  • Appel de Juarez lié dans le sang ("COJ2_Attack_16" [chanson]) ogg 48000Hz 350kb / s
  • Zombie Driver ("pickup_money" [soundfx], "main_menu" [chanson]) ogg 44100Hz 128kb / s
  • X3 Terran Conflict ("00025" [chanson]) mp3 22050Hz 56kb / s
  • Bejeweled 3 ("Coastal" [ambiant]) ogg 44100Hz 96kb / s

Etant donné que je ne pouvais pas décompresser les fichiers de données, etc. (sauf le GCF de Portal 2), les résultats pourraient ne pas montrer le spectre sur le marché. J'ai essayé de vous donner un échantillon de jeux, et ceux-ci qui n'emballent pas leurs fichiers audio semblent donner des résultats similaires.

Sprunth
la source
4000 Degrees Kelvinest du premier portail, pas le second.
Val dit Réintégrer Monica
6

D'après mon expérience (principalement des titres mobiles), la qualité audio devrait être aussi basse que possible sans effets secondaires négatifs apparents, de sorte que vous ayez plus en mémoire, par exemple.

Gardez à l'esprit que ce n'est pas parce que la compression est en cause que votre qualité est trop basse. Votre auditoire ne fera pas de comparaisons côte à côte avec les sons de base tels que vous, alors s'il manque quelque chose en raison de la compression avec pertes, il ne le saura généralement pas.

Par exemple, vous devez vous demander s'il existe une raison d'utiliser des sons ou de la musique stéréo. L'effet que cela vous donne vaut-il presque deux fois les frais généraux? Pour la musique, selon la manière dont elle a été créée, la réponse pourrait être oui. Certains moteurs ne prennent même pas en charge les sources stéréo pour les effets sonores. Ce genre de chose.

La position de cette ligne est bien entendu très subjective. Il y a d'autres réponses qui entrent dans des règles empiriques plus spécifiques.

L'important est d'avoir des normes, de les établir tôt et d'essayer de s'y tenir. Si vous écrivez de la musique pour un jeu et que vous devez diviser par deux le débit binaire pour tenir dans votre mémoire, votre situation sera bien pire que si vous définissiez un niveau de qualité faible en premier lieu.

Tetrade
la source
4

Si vous ciblez une plate-forme spécifique - iPhone, Xbox 360, PS3 -, vous devez vérifier si le matériel dispose d'un décodeur audio. Si oui, vous devriez l'utiliser. Vous économiserez du temps CPU (et de la vie de la batterie!) En déchargeant l'audio, et vous pourrez tirer pleinement parti des API de cette plate-forme. Plus important encore, cette accélération matérielle dépendra du format spécifique de votre audio - votre choix sera donc déjà fait.

Toutefois, si vous ciblez un PC, vos options sont plus variées. Je choisirais simplement le format avec la plus petite taille de fichier qui sonne toujours bien à vos oreilles et je l’utiliserais.

Blair Holloway
la source
Pouvez-vous être un peu plus précis sur les différentes consoles?
Quazi Irfan
L'idée principale est de cibler les PC sur différents systèmes d'exploitation. * NIX (y compris Mac), Windows. Mais plus tard, développera dans iOS, Android. Consoles de côté pour l'instant.
Joltmode
4

Cela dépend de ce qui va "masquer" l'encodage avec perte - si vous regardez la réponse de Sprunth, la tendance générale pour la musique est une qualité supérieure pour le menu et une qualité inférieure pour la musique de jeu. La raison est probablement parce que:

  • Dans les menus, le seul son en cours de lecture est la musique - et est donc "au point"; vous remarquerez les débits inférieurs avec pertes.
  • Dans le jeu, vous avez les effets sonores (explosions, etc.) en plus de la musique jouée à un volume inférieur; ce qui signifie que vous ne remarqueriez pas la perte de qualité.
  • L'appel des développeurs de Juarez semble aimer l'overkill.

Enfin, une autre tendance de ses réponses est que la plupart des effets sont 44KHz / 16bit; mais certains jeux plus anciens vous permettaient de fonctionner à 22 KHz / 16 bits («qualité sonore»), au cas où votre carte son ne pourrait pas gérer le taux d'échantillonnage plus élevé.

Jonathan Dickinson
la source