VBR: Ist es wirklich so schlimm, wie sie sagen?

Ich habe kürzlich einen langen Beitrag über die MP3-Codierungseinstellungen der besten hundert Podcasts in den iTunes-Charts geschrieben. Einer meiner Vorschläge war sehr umstritten: Die Leute auf Reddit waren sich nicht einig, ob es in Ordnung ist, VBR-Codierung in Podcasts zu verwenden.

Ich war überrascht von der Vehemenz, mit der die Leute darauf bestanden, dass VBR schlecht ist. „Es sollte nicht verwendet werden!“Bleiben Sie weg von VBR.“ Es gab keinen Mangel an Leuten, die vorschlugen, VBR zu vermeiden, aber wenig Substanz hinter diesen Behauptungen.

Ich machte mich daran, alle Argumente gegen VBR zu sammeln, die ich finden konnte, und recherchierte jedes, um festzustellen, ob es möglich war, die Behauptungen hinter jedem von ihnen zu überprüfen.

Zunächst jedoch einige Hintergrundinformationen.

Um Ihnen den Klick zu ersparen, gebe ich einige kurze Hintergrundinformationen. In einem MP3 haben Sie eine Bitrate. Die Bitrate ist die Anzahl der Bits, die zum Speichern einer Sekunde Audio benötigt werden. Eine MP3-Datei mit 128 kbit / s benötigt 128 Kilobit, um eine Sekunde Audio zu speichern. Wenn Sie eine MP3-Datei mit 128 kbit / s haben, die zehn Sekunden lang ist, werden 1280 Kilobit benötigt, um die Datei zu speichern. Einfach.

So funktioniert CBR oder konstante BitRate. Die gesamte Datei hat eine Bitrate. Der Nachteil dabei ist, dass nicht alle Audiodaten gleich sind. Einige Audiodaten benötigen weniger Bits zum Speichern (z. B. einen Moment der Stille). Einige Audio erfordert mehr. Wenn Sie eine Bitrate haben, verschwenden Sie möglicherweise Bits mit der Audiotreue, die Sie nicht benötigen. Hier kommt VBR oder Variable BitRate ins Spiel.

Mit VBR können Teile der Datei mit unterschiedlichen Bitraten codiert werden. Diese Sekunde der nahezu Stille könnte auf 40 kbit / s sinken, während eine Sekunde Musik auf 160 kbit / s springen könnte. Richtig gemacht, kann dies zu erheblichen Größeneinsparungen führen.

Was sind die Argumente gegen VBR?

Anstatt um den heißen Brei herumzureden, schauen wir uns die Argumente gegen VBR an und testen die Gültigkeit jedes einzelnen.

VBR unterbricht die Suche in vielen Apps.

Das ist wahr, und ich nenne das ausdrücklich in meinem Beitrag:

Mit einer CBR-Datei ist es einfach, vorwärts oder rückwärts zu springen, da Sie genau berechnen können, wohin Sie springen müssen. Mit VBR könnte das Überspringen von zehn Sekunden das Überspringen von bis zu 1280 Kilobit bedeuten — aber das könnte zu viel sein, wenn die Qualität innerhalb dieser zehn Sekunden verringert wird.

Im Wesentlichen können Sie nicht wissen, wohin Sie in der Datei springen müssen, um die Wiedergabe mit einem bestimmten Timecode zu starten, da Sie nicht eine einfache Multiplikation sind, sondern die Bitraten aller Audiodaten kennen müssen, die zu diesem Timecode führen.

Es gibt Möglichkeiten, dies zu vermeiden. Vor langer, langer Zeit haben die Leute eine Reihe von Standards entwickelt, mit denen Metadaten in MP3 eingebettet werden können, sodass Decoder herausfinden können, wohin sie suchen müssen. Ich könnte mehr darüber schreiben, aber es ist ein strittiger Punkt, weil praktisch niemand den Standard implementiert.

Es ist erwähnenswert, dass der Betrag, um den der Timecode deaktiviert ist, mit zunehmendem Fortschritt in der Datei zunimmt. Zu Beginn der Audiodatei ist es unwahrscheinlich, dass die Qualität überhaupt stark gesunken ist, und der Unterschied beträgt möglicherweise nur wenige Millisekunden. Nach ein paar Minuten, obwohl, das wird in Sekunden wachsen. Nach einer Stunde und mehr kann es zu einer Minute oder mehr wachsen.

Einige Podcasts sind sehr kurz. Betrachten Sie den Memory Palace, der in der Regel Episoden von weniger als 15 Minuten hat. Ich wäre mehr als überrascht zu hören, dass die Suche in einer VBR-codierten TMP-Episode am Ende der Datei um mehr als ein paar Handvoll Sekunden verschoben war. (Ich würde das messen, aber es ist unmöglich, ohne Zugriff auf das rohe Quellaudio richtig zu machen)

Andere Podcasts erfordern nicht wirklich eine robuste Suchfunktion. ASMR Podcasts, Podcasts mit wenig Dialog oder ohne Dialog überhaupt, und Podcasts mit sinnlosen Jabber wie die Gastgeber, sagen, Videospiele spielen alle brauchen nicht die Fähigkeit, genau zu einem bestimmten Timecode zu suchen. Dies ist ein Kompromiss, zu dem eine Anzahl von Podcasts ungleich Null bereit ist.

Die relative Suche bleibt auch von der VBR-Codierung weitgehend unberührt. Der Podcast My Brother My Brother and Me verwendet die VBR-Codierung, und es ist möglich, mit sehr guter Genauigkeit um dreißig Sekunden und um zehn Sekunden zurückzuspringen. Dafür gibt es einen guten Grund.: genau wie beim Suchen vom Anfang einer Datei an ist es unwahrscheinlich, dass die Qualität während des kleinen Zeitraums, den Sie überspringen, sehr stark abnimmt. Um dreißig Sekunden voraus zu springen, könnte bedeuten, dass man tatsächlich um, sagen wir, einunddreißig Sekunden vorausspringt. Die Höhe der Ungenauigkeit wird durch die Menge an Audio bestimmt, die Sie überspringen, die bei relativer Suche normalerweise recht klein ist.

VBR macht Dateien nicht wirklich kleiner.

Das ist die halbe Wahrheit. VBR erzeugt Dateien von fast gleicher Größe wie CBR, wenn die durchschnittliche Bitrate der VBR-Datei mit der festen Bitrate der CBR-Datei übereinstimmt. VBR erzeugt auch Dateien, deren Größe einer CBR-Datei entspricht, wenn die Bitrate niemals geändert wird (dh der Encoder entscheidet sich niemals dafür, die Qualität zu verringern, z. B. bei zufälligem Rauschen).

Ausgenommen den Fall, dass die Datei nur zufälliges Rauschen enthält (warum veröffentlichen Sie das trotzdem in Ihrem Podcast?) der Größenunterschied hat den offensichtlichen Nachteil, dass die VBR-Datei insgesamt eine gleiche oder größere Audioqualität aufweist als die CBR-Datei.

Betrachten Sie dies: sie haben eine Zehn-Sekunden-Datei. Die erste Hälfte ist fast Stille, und die zweite Hälfte ist High-Fidelity-Musik. Wenn wir dies als CBR mit 128 kbit / s codieren, sind es 1280 KB. Wenn wir es als VBR codieren und der Encoder hypothetisch die erste Hälfte mit 64 kbit / s und die zweite Hälfte mit 192 kbit / s codiert, beträgt die Dateigröße immer noch 1280 kbit / s und die durchschnittliche Bitrate beträgt immer noch 128 kbit / s. Wenn wir die Qualität vergleichen, werden wir feststellen, dass die VBR-Datei viel besser klingt, da die Stille nur die Bits verwendet, die sie benötigt, und mehr Bits der Musik gewidmet wurden.

Wenn Sie die Einstellungen Ihres Encoders anpassen, können Sie die durchschnittliche Bitrate Ihrer VBR-codierten Datei effektiv so senken, dass die Qualität in etwa der entsprechenden CBR-codierten Datei entspricht. Theoretisch führt dies zu einer allgemeinen Verringerung der Dateigröße. Wenn Sie VBR-Einstellungen wählen, ohne zu wissen, was Sie tun, können Sie jedoch leicht jeden Dateigrößenvorteil negieren, den Sie von der Verwendung von VBR ableiten würden.

VBR-Dateien zeigen nicht die richtige Dauer an.

Standardmäßig wird die Dauer einer VBR-Datei anhand ihrer Bytelänge berechnet, was zu einer Überschätzung führt (aus dem gleichen Grund, aus dem die Suche nicht funktioniert). Dies ist jedoch leicht zu beheben: Wenn Sie einfach die Audiodauer in den ID3-Tags mit einem TLEN -Frame angeben, wird die Dauer festgelegt. Einige Decoder lesen den TLEN -Frame nicht richtig, aber sie sind selten und werden fast nie mit den Apps und Geräten verwendet, von denen jemand einen Podcast konsumiert.

Encoder wie Adobe Audition erzeugen defekte VBR-kodierte Dateien.

Dies wurde an mehreren Stellen online erwähnt und geht auf einen Beitrag in den Foren von Adobe zurück. Ohne die Details zu lesen, ist es einfach, eine Wolke von FUD um dieses Problem zu erstellen. Es stellt sich heraus, dass dies in direktem Zusammenhang mit der letzten Behauptung über die Dauer steht: Audition hat die TLEN -Daten einfach nicht (angeblich) hinzugefügt.

Update: Ich möchte darauf hinweisen, dass ich dieses Problem mit Adobe Audition nicht reproduzieren konnte. Es kann sein, dass ein Problem in einer früheren Version vorhanden war, aber das scheint nicht mehr der Fall zu sein. Ich habe diesen Abschnitt aktualisiert, um expliziter anzugeben, dass ich nicht glaube, dass ein Problem mit Adobe Audition vorliegt. Danke an @audiblychuck auf Twitter für die Kontaktaufnahme.

Ich würde argumentieren, dass dies in der Verantwortung des Podcasters liegt, kein Problem für den Hörer. Es ist einfach, ID3-Tags hinzuzufügen, und Audition ist nicht das einzige Pferd in diesem Rennen. Hinter den Kulissen verwendet Audition den Fraunhofer MP3 Encoder. Der Beitrag in den Adobe-Foren bezieht sich auch auf Audition CS6, das 2012 veröffentlicht wurde; Ich wäre nicht überrascht, wenn eine neuere Version das Problem beheben würde.

Auch wenn Adobe dies nicht behoben hat, empfehlen zahlreiche Beiträge im Internet Tools (MP3val, MP3Diag usw.), die dieses Problem erkennen und beheben. Ffmpeg und LAME fügen beide korrekt das entsprechende ID3-Tag hinzu, was bedeutet, dass die meisten anderen Audiobearbeitungsprogramme standardmäßig korrekt funktionieren.

Fast alle modernen MP3-Decoder benötigen kein TLEN ID3-Tag, um die korrekte Dauer einer VBR-MP3-Datei zu bestimmen.

VBR funktioniert nicht mit bestimmten Geräten.

Es gibt anekdotische Beweise, die dies belegen. Ich habe einen HackerNews-Kommentar-Thread zur Geräteunterstützung gefunden. Hier ist der Hauptkommentar der Diskussion, über eine Erfahrung von vor über einem Jahrzehnt sprechen:

Wie sich herausstellt, hört nicht jeder mit einem modernen Gerät zu. Als wir VBR ausprobierten, konnte eine beträchtliche Anzahl von Leuten nicht zuhören, weil ihre MP3-Wiedergabe-Hardware / Software der Wahl VBR-Dateien nicht richtig unterstützte. Sie wussten nicht, dass dies das Problem war. Sie beschwerten sich nur, dass die Datei beschädigt war, während sie für alle anderen einwandfrei funktionierte.

Ein Kommentator hatte ein Problem mit seinem EigerMan F20:

Mein Lieblingsfehler war ein _ancient_ MP3-Player, den ich hatte (ein EigerMan F20), der VBR-MP3s unterstützte … unvollständig. Es unterstützte keine Dekodierungsregionen mit bestimmten Bitraten, daher wurden sie einfach stillschweigend übersprungen, was zu extremer Verwirrung meinerseits führte.

Der EigerMan F20, abgebildet mit satten 32 MB Flash-Speicher

Ein anderer Kommentator hatte mehr Glück mit seiner Nomad Jukebox 3:

Ich bin mir ziemlich sicher, dass meine Nomad Jukebox 3 VBRs gut unterstützt, und das kommt jetzt auf 14 Jahre alt.

Ein Benutzer von hydrogenaudio hatte Pech mit einem DVD-Player in 2006:

Mein DVD-Player (Samsung HD-860) spielt keine MP3-VBR-Dateien ab. Es ist ungefähr 2 Jahre alt und verfügt sogar über einen HDMI-Ausgang.

Ein anderer Kommentator im selben Thread hatte Probleme mit seinem Auto:

Mein Freund kaufte einen neuen 2008 Pontiac G5 (dies ist im Grunde der Grand Am, aber sie haben es seitdem in G5 umbenannt) und es kam mit einem werkseitig installierten MP3-CD-kompatiblen Deck. Das Gerät spielt VBR-Dateien problemlos ab, aber wir haben festgestellt, dass alle Frames im mp3 mit 128 kbit / s oder höher codiert sein müssen.

Ich werde nicht weiter Beiträge über Autos und MP3-Player von vor über einem Jahrzehnt kopieren und einfügen. Die meisten Geräte, die die Leute erwähnen, wären nicht einmal in der Lage, eine vollständige Podcast-Episode von 2017 zu halten!

Meine Recherchen im Rest des Webs ergaben ähnliche Ergebnisse. Ich konnte keinen einzigen Bericht über ein in den letzten zehn Jahren hergestelltes Gerät finden, das VBR-Dateien nicht wiedergegeben hat, und das überrascht mich nicht. Ein uncited Anspruch auf Wikipedia Staaten:

Ab Dezember 2006 sind Geräte, die nur CBR-codierte Dateien unterstützen, weitgehend veraltet, da die überwiegende Mehrheit der modernen tragbaren Musikgeräte und Software VBR-codierte Dateien unterstützt.

Ohne gegenteilige Beweise glaube ich nicht, dass Gerätekompatibilität ein gültiges Argument gegen VBR ist.

Wenn Sie Probleme mit der VBR-Kompatibilität mit einem Gerät haben, würde ich gerne davon hören. Bitte erreichen Sie!

Firefox unterstützt VBR nicht.

Das stimmt nicht mehr. Firefox unterstützt VBR-Dateien. Ich habe mich sowohl auf macOS als auch auf Windows 10 getestet. Firefox verwendet den Audio-Decoder der Host-Plattform, um MP3 abzuspielen, anstatt seinen eigenen MP3-Decoder zu bündeln. Unter Windows hört die Datei angeblich aufgrund der oben diskutierten Timecode-Probleme mitten im Stream auf zu spielen. Dies scheint überhaupt nicht mehr der Fall zu sein. Die Datei wurde einwandfrei abgespielt, ohne Abschneiden und ohne Suchprobleme.

Die Fachleute sagen, VBR nicht zu verwenden.

Ich wurde zu einem Podcast Behörden und andere Branchenexperten für ihre Ratschläge, warum VBR zu vermeiden bezeichnet. Ich war an den Argumenten interessiert, die diese Leute vorbrachten.

Update: Zum Zeitpunkt des Schreibens identifizierte ein Fehler im Code meiner Analyse 15 Podcasts in den iTunes Top 100 Podcasts fälschlicherweise als VBR verwendend. In Wahrheit verwendet nur einer die VBR-Codierung. Diese Nummer wurde in meiner Korrespondenz mit Rob Walch zitiert.

Die erste Person, mit der ich in Kontakt treten sollte, ist Rob Walch, der derzeitige Vice President of Podcaster Relations bei Libsyn. Ich schickte ihm eine E-Mail, und er antwortete mit einem Link zu einem Blog-Post. Hier ist ein Ausschnitt aus diesem Beitrag:

VBR ist ein alter Tech / Hack, der erstellt wurde, um MP3-Musikdateien kleiner zu machen und war in der Blütezeit der Dateifreigabe beliebt. Heute ist es nicht mehr nötig – verfügbare Bandbreite und Speicher sind heute viel anders als vor 15 und 20 Jahren. Aber was noch wichtiger ist ISO-Standards für MP3 erfordern keine Spieler unterstützen.

Gemäß der Norm (ISO / IEC 11172-3:1993) Abschnitt 2.4.2.3

„Um eine möglichst geringe Verzögerung und Komplexität zu gewährleisten, muss der Decoder in Schicht I oder II keine kontinuierlich variable Bitrate unterstützen. Schicht III unterstützt variable Bitrate durch Umschalten des Bitratindex. Im freien Format ist jedoch eine feste Bitrate erforderlich.“

und

„Für Layer II sind nicht alle Kombinationen von Gesamtbitrate und Modus zulässig.“

Daher wären die meisten Layer-II-Programmierer nicht für VBR geschrieben worden, und Layer-II-VBR ist ein Hack. Es funktioniert für begrenzte Fälle. Es wird ein großer Hack sein, es im gleichen Maße wie VBR im MP3-Stil zum Laufen zu bringen.

Kurz gesagt, der Tag von VBR im Licht und in der Massennutzung liegt weit hinter uns — zurück in den späten 1990er Jahren und vor dem Podcasting.

Alle diese Argumente sind die gleichen wie oben beschrieben, mit einer Handvoll Ausnahmen. Zum einen behauptet Rob, dass Bandbreite und Speicher billig sind. Das ist wahr, aber die Podcast-Hörerschaft ist in den letzten Jahren ebenfalls explodiert (sogar seit seinem Posten im Jahr 2014). International, insbesondere in Schwellenländern, ist die Bandbreite für den Hörer teuer, was ein Hindernis für eine zunehmende Hörerschaft außerhalb der USA sein kann.

Er zitiert auch die MPEG-ISO-Spezifikation, aber die Zitate, die er extrahiert, werden falsch interpretiert. MP3 steht für „MPEG-2 Audio Layer 3“, also bedeutet das Zitat „Layer III unterstützt variable Bitrate durch Umschalten des Bitratenindex“ wirklich „MP3 unterstützt variable Bitrate.“ Nach meinem Verständnis können Sie nicht MP3-kompatibel sein und VBR nicht unterstützen (gemäß der Spezifikation). Das zweite Zitat über „Layer 2“ bezieht sich auf MPEG-2 Audio Layer 2, das ein anderer Codec als MP3 ist und für die Diskussion irrelevant ist.

Ich antwortete mit diesen Kommentaren und fragte, ob er Daten habe, um diese Behauptungen zu untermauern. Die Antwort, die ich bekam, war ein bisschen … salzig.

Matt,

Ehrlich gesagt – der Artikeltitel sagte alles — Das erste und letzte Wort zu VBR.

VBR ist tot – wer darauf drängt, kämpft nur gegen Windmühlen.

CBR = gut

VBR = schlecht

Es ist wirklich so einfach — versuchen Sie nicht, mehr daraus zu machen – VBR wird von Playern und Standards NICHT vollständig unterstützt.

Wenn Sie versuchen, für VBR zu pushen – dann werden Sie irgendwann auf diese E-Mail zurückblicken und wünschen, Sie hätten mir gerade zugehört. 🙂

und schnell gefolgt von

Hallo Matt,

Wenn Sie daran gedacht haben, VBR zu verwenden oder VBR zu verwenden, und nachdem Sie meinen Artikel gelesen haben, sind Sie nicht davon überzeugt, sich zu ändern – Sie müssen das wirklich wirklich lesen:

http://theoatmeal.com/comics/believe

Es gibt eine bittere Ironie in seiner Antwort, die ich Sie finden lassen werde, wenn Sie Matthew Inmans feinen Streifen über den Backfire-Effekt lesen. Ich drückte ihn erneut, um Details anzugeben, und erhielt eine weitere kühle Antwort:

Viel Glück auf Ihrer Suche.

Ich halte VBR für ein totes Problem und rolle die Augen, wenn es auftaucht. Welches ist der Grund für den Beitrag, den ich gemacht habe.

Es scheint, dass es alle paar Jahre sein hässliches Haupt erhebt.

Ich bin mir nicht sicher, welche 15% Sie gesehen haben — das letzte Mal, als ich oben nachgesehen habe, war es 0%

http://podcast411.libsyn.com/will-increasing-your-bit-rate-equal-more-listeners

Siehe diesen Beitrag.

An dieser Stelle – es ist meine letzte Antwort auf VBR.

Zu viel zu tun, um Zeit damit zu verschwenden – der Beitrag, den ich gemacht habe, gibt Ihnen alle Informationen, die Sie benötigen, wenn Sie ihn objektiv betrachten.

Ich empfehle Ihnen wirklich, mit CBR fortzufahren, und Sie werden keine Probleme haben.

Der verlinkte Beitrag wiederholt nur Robs Mantra: „VBR = bad.“ Ohne auf objektive Fakten hinzuweisen, um seine Behauptungen zu untermauern, kann ich nicht sagen, dass Robs Meinungen zu diesem Thema viel Wasser enthalten.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.