VBR: este de fapt la fel de rău cum se spune?

am scris recent un post de lungă durată despre setările de codare MP3 de top o sută de podcast-uri pe topurile iTunes. Una dintre sugestiile mele a fost foarte controversată: oamenii de pe Reddit nu au fost de acord dacă este bine să folosiți codificarea VBR în podcast-uri.

am fost surprins de vehemența cu care oamenii au insistat că VBR este rău. „Nu trebuie folosit!””Stai departe de VBR.”Nu a existat lipsă de oameni care să sugereze evitarea VBR, dar puțin în ceea ce privește substanța din spatele acestor afirmații.

mi-am propus să colectez toate argumentele împotriva VBR pe care le-am putut găsi și am cercetat fiecare pentru a determina dacă a fost posibil să verific afirmațiile din spatele fiecăruia dintre ele.

în primul rând, deși, unele fundal.

pentru a vă salva clicul, voi da un fundal rapid. Într-un MP3, aveți un bitrate. Bitrate este numărul de biți este nevoie pentru a stoca o secundă de audio. Un fișier MP3 de 128kbps durează 128 kilobiți pentru a stoca o secundă de sunet. Dacă aveți un fișier MP3 de 128kbps care durează zece secunde, va dura 1280 kilobiți pentru a stoca fișierul. Simplu.

așa funcționează CBR sau BitRate Constant. Întregul fișier are un bitrate. Dezavantajul este că nu toate audio este creat egal. Unele audio necesită mai puțini biți pentru a stoca (să zicem, un moment de reculegere). Unele audio necesită mai mult. Având un bitrate înseamnă că sunteți potențial pierdem biți stocarea fidelitate audio care nu aveți nevoie. Asta în cazul în care VBR, sau BitRate variabilă, vine în.

VBR permite bucăți de fișier să fie codificate la rate de biți diferite. Acea secundă de aproape tăcere s-ar putea strivi până la 40kbps, în timp ce o secundă de muzică ar putea sări până la 160kbps. Realizat corect, acest lucru poate produce economii foarte substanțiale în dimensiune.

care sunt argumentele împotriva VBR?

mai degrabă decât bate în jurul bush, să sară în și uita-te la argumentele împotriva VBR și testa validitatea fiecare.

pauze VBR caută în o mulțime de aplicații.

acest lucru este adevărat, și eu numesc în mod special acest lucru în postul meu:

cu un fișier CBR, săriți înainte sau înapoi este ușor, deoarece puteți calcula exact unde să săriți. Cu VBR, sărind peste zece secunde înainte ar putea însemna sărind peste până la 1280 kilobiți-dar asta ar putea fi prea mult dacă calitatea este redusă în acele zece secunde.

în esență, nu poți ști unde să sari în fișierul pentru a începe redarea la un anumit timecode, pentru că în loc de a fi o multiplicare simplu, trebuie să știți bitrate de toate audio duce până la acel timecode.

există modalități de a evita acest lucru. Cu mult, mult timp în urmă, oamenii au creat o serie de standarde care permit metadatelor să fie încorporate în MP3, permițând decodoarelor să-și dea seama unde să caute. Aș putea scrie mai multe despre acest lucru, dar este un punct discutabil, deoarece practic nimeni nu implementează standardul.

este demn de remarcat faptul că suma cu care timecode este oprit crește pe măsură ce ajunge mai departe de-a lungul în fișierul. La începutul fișierului audio, este puțin probabil ca calitatea să fi scăzut cu foarte mult, iar diferența ar putea fi doar câteva milisecunde. După câteva minute, însă, asta va crește în secunde. După o oră și în sus, se poate ajunge să crească la un minut sau mai mult.

unele podcast-uri sunt foarte scurte. Luați în considerare Palatul memoriei, care are în general episoade mai mici de 15 minute. Aș fi mai mult decât surprins să aud că căutarea într-un episod T. M. p codificat VBR a fost oprită cu mai mult de câteva mâini de secunde până la sfârșitul fișierului. (Aș măsura acest lucru, dar este imposibil de făcut corect fără acces la sursa audio brută)

alte podcast-uri nu necesită cu adevărat o caracteristică robustă de căutare. Podcast-uri ASMR, podcast-uri cu dialog mic sau fără dialog deloc și podcast-uri cu jabber fără minte ca gazde, să zicem, să joace jocuri video, toate nu au nevoie de capacitatea de a căuta cu exactitate un anumit cod de timp. Acesta este un compromis pe care un număr diferit de podcast-uri sunt dispuși să îl facă.

căutarea relativă este, de asemenea, în mare măsură neafectată de codificarea VBR. Podcast fratele meu fratele meu și cu mine folosește codificarea VBR și este posibil să săriți înainte cu treizeci de secunde și înapoi cu zece secunde cu o precizie foarte bună. Există un motiv bun pentru acest punct de vedere tehnic: la fel ca și căutarea de la începutul unui fișier, este puțin probabil ca calitatea să scadă foarte mult în timpul micului timp în care săriți înainte. Sărind peste înainte de treizeci de secunde ar putea însemna de fapt sărind peste înainte de, să zicem, treizeci și unu de secunde. Cantitatea de inexactitate este determinată de cantitatea de sunet pe care o săriți, care, cu căutarea relativă, este de obicei destul de mică.

VBR nu face de fapt fișiere mai mici.

acest lucru este pe jumătate adevărat. VBR va produce fișiere de dimensiuni aproape egale cu CBR dacă bitrate-ul mediu al fișierului VBR este același cu bitrate-ul fix al fișierului CBR. VBR va produce, de asemenea, fișiere de dimensiuni egale cu un fișier CBR dacă nu schimbă niciodată rata de biți (adică codificatorul nu alege niciodată să scadă calitatea, cum ar fi zgomotul aleatoriu).

excluzând cazul în care fișierul conține doar zgomot aleatoriu (De ce publicați asta în podcast-ul dvs. oricum?) diferența de dimensiune are avertismentul evident că fișierul VBR va avea o calitate audio egală sau mai mare decât fișierul CBR.

luați în considerare acest lucru: ai un dosar de zece secunde. Prima jumătate este aproape de tăcere, iar a doua jumătate este muzică de înaltă fidelitate. Dacă vom codifica acest lucru ca CBR la 128kbps, va fi 1280kb. Dacă îl codificăm ca VBR, iar codificatorul codifică ipotetic prima jumătate la 64kbps și a doua jumătate la 192kbps, Dimensiunea fișierului va fi în continuare 1280kb, iar rata medie de biți este încă 128kbps. Comparând calitatea, totuși, vom găsi fișierul VBR sună mult mai bine, deoarece tăcerea folosește doar biții de care are nevoie și mai mulți biți au fost dedicați muzicii.

prin reglarea setărilor codificatorului, puteți reduce în mod eficient rata medie de biți a fișierului codificat VBR, astfel încât calitatea să se potrivească aproximativ cu fișierul codificat CBR echivalent. În teorie, acest lucru va duce la o reducere generală a dimensiunii fișierului. Dacă alegeți setările VBR fără să știți ce faceți, totuși, puteți ajunge cu ușurință să negați orice beneficiu de dimensiune a fișierului pe care l-ați obține din utilizarea VBR pentru a începe.

fișierele VBR nu afișează durata corectă.

în mod implicit, nu, Durata unui fișier VBR va fi calculată prin lungimea sa de octeți, rezultând o supraestimare (din același motiv pentru care căutarea nu funcționează). Acest lucru este ușor de remediat, deși: pur și simplu specificând durata audio în etichetele ID3 folosind un TLEN cadru va stabili durata. Unele decodoare nu citesc corect cadrul TLEN, dar sunt puține și rare și nu sunt aproape niciodată utilizate cu aplicațiile și dispozitivele de la care cineva ar putea consuma un podcast.

codificatoare precum Adobe Audition generează fișiere codate VBR rupte.

acesta este un lucru pe care l-am găsit menționat online într-o serie de locuri, urmărind înapoi la o postare pe forumurile Adobe. Fără a citi detaliile, este ușor să creați un nor de FUD în jurul acestei probleme. Se pare că acest lucru este direct legat de ultima afirmație despre durată: Audition pur și simplu nu a fost (presupus) adăugarea datelor TLEN.

actualizare: aș dori să rețineți că nu am fost capabil de a reproduce această problemă cu Adobe Audition. Este posibil ca o problemă să existe într-o versiune anterioară, dar asta nu mai pare să fie cazul. Am actualizat această secțiune pentru a afirma mai explicit că nu cred că există o problemă cu Adobe Audition. Vă mulțumim pentru @ audiblychuck pe Twitter pentru a ajunge.

aș face argumentul că aceasta este responsabilitatea podcasterului, nu o problemă pentru ascultător. Este ușor să adăugați etichete ID3, iar Audition nu este singurul cal din această cursă. În spatele scenei, Audition folosește codificatorul MP3 Fraunhofer. Postarea de pe forumurile Adobe se referă și la Audition CS6, lansată în 2012; nu aș fi surprins dacă o versiune mai recentă ar rezolva problema.

chiar dacă Adobe nu a rezolvat acest lucru, numeroase postări de pe internet recomandă instrumente (MP3val, MP3Diag etc.) care detectează și rezolvă această problemă. Ffmpeg și LAME adaugă corect eticheta ID3 corespunzătoare, ceea ce înseamnă că majoritatea celorlalte programe de editare audio vor funcționa corect în mod implicit.

aproape toate decodoarele MP3 moderne nu necesită o etichetă TLEN ID3 pentru a determina durata corectă a unui fișier MP3 VBR.

VBR nu funcționează cu anumite dispozitive.

există dovezi anecdotice care susțin acest lucru. Am găsit un HackerNews comentarii fir despre Suport dispozitiv. Iată comentariul rădăcină al discuției, vorbind despre o experiență de acum peste un deceniu:

după cum se dovedește, nu toată lumea ascultă folosind un dispozitiv modern. Când am încercat VBR un număr semnificativ de oameni nu au putut asculta, deoarece lor mp3 joc hardware/software de alegere nu au suport pentru fișiere VBR în mod corespunzător. Nu și-au dat seama că asta e problema. Tocmai s-au plâns că fișierul a fost corupt în timp ce funcționa bine pentru toți ceilalți.

un comentator a avut o problemă cu EigerMan F20:

bug-ul meu preferat despre acest lucru a fost pe un _ancient_ MP3 player am avut (un EigerMan F20), care a sprijinit MP3-uri VBR…incomplet. Nu suporta regiuni de decodare cu anumite rate de biți, așa că le-ar sări în tăcere, ducând la confuzie extremă din partea mea.

EigerMan F20, imaginat cu un enorm 32MB de stocare flash

un alt comentator a avut mai mult noroc cu Nomad jukebox 3:

sunt destul de sigur meu Nomad Jukebox 3 sprijinit VBRs bine, și că vine pe 14 ani acum.

un utilizator de pe hydrogenaudio a avut ghinion cu un DVD player în 2006:

DVD player-ul meu (Samsung HD-860) nu redă fișiere mp3 vbr. Are aproximativ 2 ani și chiar vine cu o ieșire HDMI.

un alt comentator în același fir a avut probleme cu mașina lui:

prietenul meu a cumpărat un nou 2008 Pontiac G5 (acest lucru este în esență Grand Am, dar au redenumit-o la G5) și a venit cu o punte compatibil MP3-CD instalat din fabrică. Unitatea va reda fișiere VBR foarte bine, dar am descoperit că toate cadrele din mp3 trebuie să fie codificate la 128kbps sau mai mare.

Nu voi continua să copiez și să lipesc postări despre mașini și playere MP3 de acum peste un deceniu. Majoritatea dispozitivelor pe care oamenii le menționează nu ar putea nici măcar să dețină un episod complet de podcast din 2017!

cercetările mele din restul Internetului au dat rezultate similare. Nu am putut găsi un singur raport al unui dispozitiv realizat în ultimii zece ani care nu a reușit să redea fișiere VBR, iar acest lucru nu mă surprinde. O afirmație necitată pe Wikipedia afirmă:

din decembrie 2006, dispozitivele care acceptă numai fișiere CBR codificate sunt în mare parte învechite, deoarece marea majoritate a dispozitivelor muzicale portabile moderne și a software-ului acceptă fișiere codificate VBR.

fără nicio dovadă contrară, nu cred că compatibilitatea dispozitivului este un argument valid împotriva VBR.

dacă ați experimentat probleme de compatibilitate VBR cu un dispozitiv, mi-ar plăcea să aud despre asta. Vă rugăm să ajungă!

Firefox nu acceptă VBR.

acest lucru nu mai este adevărat. Firefox acceptă fișiere VBR. M-am testat atât pe macOS, cât și pe Windows 10. Firefox folosește decodorul audio al platformei gazdă pentru a reda MP3, mai degrabă decât să grupeze propriul decodor MP3. Pe Windows, fișierul se presupune că se oprește din redarea fluxului mediu din cauza problemelor de cod de timp discutate mai sus. Acest lucru nu mai pare să fie cazul deloc. Fișierul a jucat foarte bine, fără trunchiere și fără probleme de căutare.

profesioniștii spun să nu folosească VBR.

am fost referit la un autoritățile podcast și alți profesioniști din industrie pentru sfatul lor cu privire la ce, pentru a evita VBR. Am fost interesat de argumentele pe care acești oameni le-au prezentat.

actualizare: la momentul scrierii, o eroare din Codul analizei mele a identificat incorect 15 podcast-uri din iTunes Top 100 podcast-uri ca folosind VBR. Într-adevăr, doar unul folosește codificarea VBR. Acest număr a fost citat în corespondența mea cu Rob Walch.

prima persoană cu care mi s-a spus să intru în contact este Rob Walch, care este actualul vicepreședinte al relațiilor podcaster la Libsyn. I-am trimis un e-mail, iar el a răspuns cu un link către o postare pe blog. Iată un fragment din acea postare:

VBR este un vechi tech / hack, care a fost creat pentru a face fișiere de muzică MP3 mai mici și a fost popular înapoi în perioada de glorie de partajare de fișiere. Astăzi nu este nevoie de ea — lățimea de bandă și stocarea disponibilă astăzi sunt mult diferite de acum 15 și 20 de ani. Dar, mai important, standardele ISO pentru MP3 nu necesită ca jucătorii să o susțină.

conform standardului (ISO/IEC 11172-3:1993) secțiunea 2.4.2.3

„pentru a oferi cea mai mică întârziere și complexitate posibilă, decodorul nu este obligat să suporte un bitrate variabil continuu atunci când este în stratul I sau II. stratul III acceptă bitrate variabil prin comutarea indicelui bitrate. Cu toate acestea, în format liber, este necesar un bitrate fix.”

și

„pentru stratul II, nu sunt permise toate combinațiile de bitrate și mod total.”

prin urmare, majoritatea codificatorilor Layer II nu ar fi fost scrise cu VBR în minte, iar Layer II VBR este un hack. Funcționează pentru cazuri limitate. Noțiuni de bază-l să funcționeze în aceeași măsură ca MP3-stil VBR va fi un hack majore.

pe scurt, ziua VBR în lumina și utilizarea în masă este mult în spatele nostru — înapoi la sfârșitul anilor 1990 și pre-podcasting.

toate aceste argumente sunt aceleași pe care le-am acoperit mai sus, cu câteva excepții. Pentru unul, Rob susține că lățimea de bandă și stocarea sunt ieftine. Acest lucru este adevărat, dar ascultarea podcasturilor a explodat și în ultimii ani (chiar de la postul său din 2014). La nivel internațional, în special pe piețele emergente, lățimea de bandă este costisitoare pentru ascultător, ceea ce poate fi o barieră în calea creșterii ascultării în afara SUA.

el citează, de asemenea, specificațiile ISO MPEG, dar citatele pe care le extrage sunt interpretate greșit. MP3 înseamnă „MPEG-2 Audio Layer 3″, astfel încât citatul” Layer III acceptă bitrate variabil prin comutarea indexului bitrate, „înseamnă cu adevărat” MP3 acceptă bitrate variabil.”Pentru înțelegerea mea, nu poate fi mp3-compatibil și nu suport VBR (pe spec). Al doilea citat despre „Layer 2” se referă la MPEG-2 Audio Layer 2, Care este un codec diferit de MP3 în întregime și este irelevant pentru discuție.

i-am răspuns cu aceste comentarii, întrebându-l dacă are date care să ajute la fundamentarea acestor afirmații. Răspunsul pe care l-am primit a fost un pic…sărat.

Matt,

sincer — titlul articolului a spus totul — primul și ultimul cuvânt pe VBR.

VBR este mort — oricine împinge pentru ea este doar lupta morile de vânt.

CBR = bun

VBR = rău

este într — adevăr este atât de simplu — nu încercați să facă mai mult din acest lucru-VBR nu este pe deplin sprijin de jucători și standarde.

dacă încercați să împingeți pentru VBR-atunci în cele din urmă vă veți uita înapoi la acest e-mail și vă doresc doar să mă ascultați. 🙂

și urmat rapid de

bună Matt,

dacă te-ai gândit să folosești VBR sau folosești VBR și după ce ai citit articolul meu nu ești convins să schimbi-trebuie să citești cu adevărat acest lucru:

http://theoatmeal.com/comics/believe

există o ironie amară în răspunsul său, pe care vă voi lăsa să o găsiți în timp ce citiți banda fină a lui Matthew Inman despre efectul backfire. L-am presat din nou pentru a oferi detalii, și a primit un alt răspuns rece:

mult noroc în căutarea ta.

consider VBR o problemă mort și rola ochii atunci când vine vorba. Acesta este motivul pentru postarea pe care am făcut-o.

se pare că la fiecare doi ani își ridică capul urât.

nu sunt sigur ce 15% ai văzut-ultima dată când am verificat top arată că a fost 0%

http://podcast411.libsyn.com/will-increasing-your-bit-rate-equal-more-listeners

vezi acest post.

în acest moment — este ultimul meu răspuns pe VBR.

prea multe de făcut pentru a pierde timpul în acest sens — postarea pe care am făcut-o vă oferă toate informațiile de care aveți nevoie dacă o priviți obiectiv.

chiar vă recomand să treceți la CBR și nu veți avea probleme.

postarea legată repetă doar mantra lui Rob: „VBR = rău.”Fără a indica fapte obiective pentru a susține afirmațiile pe care le face, nu pot spune că opiniile lui Rob în această privință au multă apă.

Lasă un răspuns

Adresa ta de email nu va fi publicată.