VBR: je to vlastně tak špatné, jak se říká?

nedávno jsem napsal dlouhý příspěvek o nastavení kódování MP3 z nejlepších sto podcastů na grafech iTunes. Jeden z mých návrhů byl velmi kontroverzní: lidé na Redditu nesouhlasili s tím, zda je v pořádku používat kódování VBR v podcastech.

byl jsem překvapen vehemencí, s jakou lidé trvali na tom, že VBR je špatná. „Nemělo by se to používat!““Drž se dál od VBR.“Nebyl nedostatek lidí, kteří by navrhli vyhnout se VBR, ale jen málo ve způsobu podstaty těchto tvrzení.

rozhodl jsem se shromáždit všechny argumenty proti VBR, které jsem našel, a prozkoumal každý, abych zjistil, zda je možné ověřit nároky za každým z nich.

nejprve však nějaké pozadí.

Chcete-li uložit kliknutí, dám nějaké rychlé pozadí. V MP3 máte datový tok. Datový tok je počet bitů potřebných k uložení jedné sekundy zvuku. 128kbps MP3 soubor trvá 128 kilobitů uložit jednu sekundu zvuku. Pokud máte 128kbps MP3 soubor, který je dlouhý deset sekund, bude trvat 1280 kilobitů pro uložení souboru. Jednoduchý.

takto funguje CBR nebo konstantní datový tok. Celý soubor má jeden datový tok. Nevýhodou je, že ne všechny audio je vytvořen stejný. Některé audio vyžaduje méně bitů pro uložení (řekněme, chvíli ticha). Některé audio vyžaduje více. Mít jeden datový tok znamená, že potenciálně ztrácíte bity ukládající věrnost zvuku, kterou nepotřebujete. To je místo, kde VBR, nebo variabilní datový tok, přichází.

VBR umožňuje zakódování částí souboru při různých přenosových rychlostech. Tato sekunda téměř ticha by se mohla zmenšit na 40kbps, zatímco druhá Hudba by mohla vyskočit na 160kbps. Provedeno správně, může to přinést velmi značné úspory ve velikosti.

jaké jsou argumenty proti VBR?

spíše než bít kolem horké kaše, pojďme skočit a podívat se na argumenty proti VBR a otestovat platnost každého z nich.

VBR přestávky hledá v mnoha aplikacích.

to je pravda, a já to konkrétně nazývám ve svém příspěvku:

se souborem CBR je přeskočení dopředu nebo dozadu snadné, protože můžete přesně vypočítat, kam skočit. U VBR může přeskočení o deset sekund dopředu znamenat přeskočení až 1280 kilobitů-ale to by mohlo být příliš mnoho, pokud se kvalita během těchto deseti sekund sníží.

v podstatě nemůžete vědět, kam v souboru skočit, abyste mohli začít hrát v určitém časovém kódu, protože místo jednoduchého násobení potřebujete znát přenosové rychlosti veškerého zvuku vedoucího k tomuto časovému kódu.

existují způsoby, jak se tomu vyhnout. Dlouho, dávno, lidé vytvořili řadu standardů, které umožňují vložení metadat do MP3, což umožňuje dekodérům zjistit, kam hledat. Mohl bych o tom napsat více, ale je to sporný bod, protože standard prakticky nikdo implementuje.

stojí za zmínku, že částka, o kterou je časový kód vypnutý, roste, jak se v souboru dostanete dále. Na začátku zvukového souboru je nepravděpodobné, že by kvalita vůbec klesla a rozdíl by mohl být jen několik milisekund. Po několika minutách, ačkoli, to poroste do sekund. Po hodině a nahoru, to může dostat růst na minutu nebo více.

některé podcasty jsou velmi krátké. Zvažte Palác paměti, který má obvykle epizody kratší než 15 minut. Byl bych více než překvapen, když jsem slyšel, že hledání v epizodě T. M. P. kódované VBR bylo na konci souboru vypnuto o více než několik hrstek sekund. (Změřil bych to, ale je nemožné to udělat správně bez přístupu k surovému zdrojovému zvuku)

jiné podcasty opravdu nevyžadují robustní vyhledávací funkci. SSHR podcasty, podcasty s malým dialogu nebo bez dialogu vůbec, a podcasty s mindless jabber jako hostitelé, řekněme, hrát videohry všichni nepotřebují schopnost přesně usilovat o konkrétní časový kód. Jedná se o kompromis, který je nenulový počet podcastů ochoten udělat.

relativní hledání je také do značné míry neovlivněno kódováním VBR. Podcast můj bratr můj bratr a já používá kódování VBR, a je možné přeskočit dopředu o třicet sekund a zpět o deset sekund s velmi dobrou přesností. Technicky to má dobrý důvod: stejně jako hledání od začátku souboru, je nepravděpodobné, že se kvalita během malého kusu času, který přeskočíte, velmi sníží. Přeskočení vpřed o třicet sekund může znamenat ve skutečnosti přeskočení vpřed, říci, třicet jedna sekund. Množství nepřesnosti je určeno množstvím zvuku, který přeskakujete, což je při relativním hledání obvykle poměrně malé.

VBR ve skutečnosti nezmenšuje soubory.

to je napůl pravda. VBR vytvoří soubory téměř stejné velikosti jako CBR, pokud je průměrný datový tok souboru VBR stejný jako pevný datový tok souboru CBR. VBR také vytvoří soubory stejné velikosti jako soubor CBR, pokud nikdy nezmění datový tok (tj.

s výjimkou případu, kdy soubor obsahuje pouze náhodný šum (proč to vlastně publikujete ve svém podcastu?) rozdíl ve velikosti má zjevnou námitku, že soubor VBR bude mít celkově stejnou nebo větší kvalitu zvuku než soubor CBR.

zvažte toto: máte desetisekundovou složku. První polovina je téměř tichá a druhá polovina je vysoce věrná Hudba. Pokud to zakódujeme jako CBR při 128kbps, bude to 1280kb. Pokud jej kódujeme jako VBR a kodér hypoteticky kóduje první polovinu při 64kbps a druhou polovinu při 192kbps, Velikost souboru bude stále 1280kb a průměrný datový tok je stále 128kbps. Porovnáním kvality však zjistíme, že soubor VBR zní mnohem lépe, protože ticho používá pouze bity, které potřebuje, a více bitů bylo věnováno hudbě.

vyladěním nastavení kodéru můžete efektivně snížit průměrný datový tok vašeho souboru kódovaného VBR tak, aby kvalita zhruba odpovídala ekvivalentnímu souboru kódovanému CBR. Teoreticky to povede k celkovému zmenšení velikosti souboru. Pokud zvolíte nastavení VBR, aniž byste věděli, co děláte, můžete snadno skončit negací jakékoli výhody velikosti souboru, kterou byste získali z použití VBR.

soubory VBR nezobrazují správnou dobu trvání.

ve výchozím nastavení se doba trvání souboru VBR vypočítá podle délky bajtu, což má za následek nadhodnocení(ze stejného důvodu, že vyhledávání nefunguje). To však lze snadno napravit: jednoduše zadáním délky zvuku ve značkách ID3 pomocí rámečku TLEN opravíte dobu trvání. Některé dekodéry nečtou rámeček TLEN správně, ale je jich málo a jsou téměř nikdy používány s aplikacemi a zařízeními, ze kterých by někdo mohl podcast konzumovat.

kodéry jako Adobe Audition generují poškozené soubory kódované VBR.

to je něco, co jsem našel zmínil on-line na mnoha místech, trasování zpět k příspěvku na fórech Adobe. Bez přečtení podrobností je snadné vytvořit kolem tohoto problému oblak FUD. Ukazuje se, že to přímo souvisí s posledním tvrzením o délce trvání: konkurz prostě (údajně) nepřidával data TLEN.

aktualizace: rád bych poznamenal, že jsem nebyl schopen reprodukovat tento problém s Adobe Audition. Je možné, že problém existoval v předchozí verzi, ale zdá se, že tomu tak již není. Aktualizoval jsem tuto část tak, aby explicitněji uvedla, že nevěřím, že je problém s Adobe Audition. Díky @audiblychuck na Twitteru za oslovení.

já bych argument, že to je odpovědnost podcaster, není problém pro posluchače. Je snadné přidat značky ID3 a konkurz není jediným koněm v tomto závodě. V zákulisí používá Audition kodér Fraunhofer MP3. Příspěvek na fórech společnosti Adobe se také týká Audition CS6, vydané v 2012; nebyl bych překvapen, kdyby novější verze problém vyřešila.

i když to Adobe neopravilo, četné příspěvky po internetu doporučují nástroje (MP3val, MP3Diag atd.), které detekují a opravují tento problém. Ffmpeg a LAME oba správně přidat příslušnou značku ID3, což znamená, že většina ostatních audio editační software bude fungovat správně ve výchozím nastavení.

téměř všechny moderní dekodéry MP3 nevyžadují značku TLEN ID3 k určení správné doby trvání souboru MP3 VBR.

VBR nefunguje s určitými zařízeními.

existují neoficiální důkazy, které to podporují. Našel jsem HackerNews Komentáře vlákno o podpoře zařízení. Zde je kořenový komentář diskuse, mluvit o zkušenostech z doby před více než deseti lety:

jak se ukazuje, ne každý poslouchá pomocí moderního zařízení. Když jsme se snažili VBR značný počet lidí nemohl poslouchat, protože jejich MP3 přehrávání hardware / software volby nepodporoval VBR soubory správně. Neuvědomili si, že to je problém. Jen si stěžovali, že soubor byl poškozen, zatímco to fungovalo dobře pro všechny ostatní.

jeden komentátor měl problém s jejich EigerMan F20:

moje oblíbená chyba byla na přehrávači _ANCIENT_ MP3, který jsem měl (eigerman F20), který podporoval MP3 VBR … neúplně. Nepodporoval dekódování regionů s určitými přenosovými rychlostmi, takže by je jen tiše přeskočil, což by z mé strany vedlo k extrémnímu zmatku.

Eigerman F20, na snímku s neuvěřitelným 32MB flash úložiště

další komentátor měl větší štěstí se svým Nomad Jukebox 3:

jsem si docela jistý, že můj Nomad Jukebox 3 podporoval VBRs v pořádku, a to se blíží 14 let.

uživatel na hydrogenaudio měl smůlu s DVD přehrávačem v 2006:

Můj DVD přehrávač (Samsung HD-860)nepřehrává soubory mp3 vbr. Je to asi 2 let a dokonce přichází s výstupem HDMI.

jiný komentátor ve stejném vlákně měl potíže se svým autem:

můj přítel koupil nový 2008 Pontiac G5 (to je v podstatě Grand Am, ale od té doby jej přejmenovali na G5)a přišel s továrně nainstalovaným balíčkem kompatibilním s mp3-CD. Jednotka bude přehrávat soubory VBR v pohodě, ale zjistili jsme, že všechny snímky v mp3 musí být kódovány na 128kbps nebo vyšší.

nebudu kopírovat a vkládat příspěvky o autech a přehrávačích MP3 z doby před více než deseti lety. Většina zařízení, která lidé zmiňují, by ani nebyla schopna uspořádat úplnou epizodu podcastu od roku 2017!

můj výzkum ve zbytku webu přinesl podobné výsledky. Nemohl jsem najít jedinou zprávu o zařízení vyrobeném za posledních deset let, které nedokázalo přehrát soubory VBR, a to mě nepřekvapuje. Necitovaný nárok na Wikipedii uvádí:

od prosince 2006, zařízení, která podporují pouze CBR kódované soubory jsou do značné míry zastaralé, jako drtivá většina moderních přenosných hudebních zařízení a software podporuje VBR kódované soubory.

bez důkazů o opaku nevěřím, že kompatibilita zařízení je platným argumentem proti VBR.

pokud jste zaznamenali problémy s kompatibilitou VBR se zařízením, rád bych o tom slyšel. Prosím, ozvěte se!

Firefox nepodporuje VBR.

to již není pravda. Firefox podporuje soubory VBR. Testoval jsem se na macOS i Windows 10. Firefox používá audio dekodér hostitelské platformy k přehrávání MP3 spíše než sdružování vlastního dekodéru MP3. V systému Windows soubor údajně přestane přehrávat střední proud kvůli problémům s časovým kódem diskutovaným výše. Zdá se, že tomu tak již vůbec není. Soubor hrál v pohodě, bez zkrácení a bez problémů s hledáním.

odborníci říkají, že nepoužívají VBR.

byl jsem odkázán na orgány podcastu a další profesionály v oboru, aby mi poradili, proč se vyhnout VBR. Zajímaly mě argumenty, které tito lidé předložili.

aktualizace: v době psaní byla chyba v kódu mé analýzy nesprávně identifikována 15 podcasty v iTunes top 100 podcasty jako pomocí VBR. Ve skutečnosti pouze jeden používá kódování VBR. Toto číslo bylo citováno v mé korespondenci s Robem Walchem.

první osoba, se kterou jsem se dostal do kontaktu, je Rob Walch, který je současným viceprezidentem podcasterových vztahů v Libsyn. Poslal jsem mu e-mail, a on odpověděl odkazem na blogový příspěvek. Zde je úryvek z tohoto příspěvku:

VBR je starý tech / hack, který byl vytvořen, aby se hudební soubory MP3 menší a byl populární zpět v rozkvětu sdílení souborů. Dnes to není potřeba — dostupná šířka pásma a úložiště jsou dnes mnohem jiné než před 15 a 20 lety. Ale co je důležitější, normy ISO pro MP3 nevyžadují, aby je hráči podporovali.

podle normy (ISO/IEC 11172-3:1993) oddíl 2.4.2.3

„pro zajištění co nejmenšího zpoždění a složitosti není dekodér vyžadován pro podporu kontinuálně proměnného datového toku, když ve vrstvě I nebo II. vrstva III podporuje variabilní datový tok přepnutím indexu datového toku. Ve volném formátu je však vyžadován pevný datový tok.“

a

“ pro vrstvu II nejsou povoleny všechny kombinace celkového datového toku a režimu.“

proto by většina kodérů vrstvy II nebyla napsána s ohledem na VBR a vrstva II VBR je hack. Funguje to pro omezené případy. Dostat to do práce ve stejném rozsahu jako MP3 stylu VBR bude hlavní hack.

zkrátka den VBR ve světle a masovém použití je za námi – zpět v pozdních 1990 a před podcastingem.

všechny tyto argumenty jsou stejné, jak jsme se zabývali výše, s několika výjimkami. Pro jednoho, Rob tvrdí, že šířka pásma a úložiště jsou levné. To je pravda ,ale poslech podcastů v posledních letech také explodoval (dokonce od jeho funkce v roce 2014). Mezinárodně, zejména na rozvíjejících se trzích, šířka pásma je pro posluchače drahá, což může být překážkou pro zvýšení posluchače mimo USA.

cituje také MPEG ISO spec, ale citace, které extrahuje, jsou nesprávně interpretovány. MP3 je zkratka pro „MPEG-2 Audio Layer 3“, takže citace „Layer III podporuje variabilní datový tok přepnutím indexu datového toku, „opravdu znamená“ MP3 podporuje variabilní datový tok.“Podle mého chápání nemůžete být kompatibilní s MP3 a nepodporovat VBR(podle specifikace). Druhý citát o „Layer 2“ odkazuje na MPEG-2 Audio Layer 2, což je úplně jiný kodek než MP3 a je pro diskusi irelevantní.

odpověděl jsem těmito připomínkami a zeptal jsem se, zda má údaje, které by pomohly tato tvrzení doložit. Odpověď, kterou jsem dostal, byla trochu … slaná.

Matt,

upřímně-název článku řekl Vše-první a poslední slovo na VBR.

VBR je mrtvý-každý, kdo se o to snaží, jen bojuje s větrnými mlýny.

CBR = dobrý

VBR = špatný

je to opravdu tak jednoduché-nesnažte se z toho vydělat více-VBR není plně podporován hráči a standardy.

pokud se snažíte prosadit VBR-pak se nakonec ohlédnete zpět na tento e-mail a přejete si, abyste mě jen poslouchali. 🙂

a rychle následuje

Ahoj Matt,

pokud jste uvažovali o použití VBR nebo používáte VBR a po přečtení mého článku nejste přesvědčeni o změně-musíte si to opravdu přečíst:

http://theoatmeal.com/comics/believe

v jeho odpovědi je hořká ironie, kterou vám dovolím najít, když čtete jemný proužek Matthewa Inmana o efektu backfire. Znovu jsem ho stiskl, abych poskytl podrobnosti, a dostal další chladnou odpověď:

hodně štěstí na vaší cestě.

považuji VBR za mrtvý problém a když se objeví, obrátím oči. Což je důvod pro příspěvek, který jsem udělal.

zdá se, že každých pár let zvedá svou ošklivou hlavu.

nejste si jisti, co 15% jste viděli-naposledy jsem zkontroloval top ukazuje, že to bylo 0%

http://podcast411.libsyn.com/will-increasing-your-bit-rate-equal-more-listeners

viz tento příspěvek.

v tomto bodě – je to moje poslední odpověď na VBR.

příliš mnoho na to, abyste na to ztratili čas-příspěvek, který jsem vytvořil, vám poskytne všechny informace, které potřebujete, pokud se na to podíváte objektivně.

opravdu doporučuji přejít na CBR a nebudete mít žádné problémy.

odkazovaný příspěvek pouze opakuje robovu mantru: „VBR = bad.“Aniž bych poukazoval na objektivní fakta, abych podpořil tvrzení, která činí, nemohu říci, že Robovy názory na tuto záležitost drží hodně vody.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.