VBR: ¿es realmente tan malo como dicen?

Recientemente escribí una larga publicación sobre la configuración de codificación MP3 de los cien podcasts principales en las listas de iTunes. Una de mis sugerencias fue muy controvertida: la gente de Reddit no estaba de acuerdo sobre si estaba bien usar codificación VBR en podcasts.

Me sorprendió la vehemencia con la que la gente insistía en que VBR es malo. «¡ No debe usarse!»»Aléjate de VBR.»No había escasez de personas que sugirieran evitar el VBR, pero había poca sustancia detrás de esas afirmaciones.

Me dispuse a recopilar todos los argumentos en contra de VBR que pude encontrar, e investigué cada uno para determinar si era posible verificar las afirmaciones detrás de cada uno de ellos.

En primer lugar, sin embargo, algunos antecedentes.

Para guardarte el clic, te daré un poco de fondo rápido. En un MP3, tienes una tasa de bits. La tasa de bits es el número de bits que se necesitan para almacenar un segundo de audio. Un archivo MP3 de 128 kbps tarda 128 kilobits en almacenar un segundo de audio. Si tienes un archivo MP3 de 128 kbps que dura diez segundos, necesitarás 1280 kilobits para almacenar el archivo. Simple.

Así es como funciona CBR, o Tasa de bits constante. Todo el archivo tiene una tasa de bits. La desventaja de esto es que no todo el audio se crea igual. Algunos archivos de audio requieren menos bits para almacenar (por ejemplo, un momento de silencio). Algo de audio requiere más. Tener una tasa de bits significa que está desperdiciando bits que almacenan fidelidad de audio que no necesita. Ahí es donde entra en juego VBR, o Tasa de bits variable.

VBR permite codificar trozos del archivo a diferentes velocidades de bits. Ese segundo de casi silencio podría reducirse a 40 kbps, mientras que un segundo de música podría saltar a 160 kbps. Hecho correctamente, esto puede producir ahorros muy sustanciales en tamaño.

¿Cuáles son los argumentos en contra de VBR?

En lugar de andar por las ramas, echemos un vistazo a los argumentos en contra de VBR y probemos la validez de cada uno.

VBR se rompe buscando en muchas aplicaciones.

Esto es cierto, y lo menciono específicamente en mi publicación:

Con un archivo CBR, saltar hacia adelante o hacia atrás es fácil porque puede calcular exactamente a dónde saltar. Con VBR, saltar diez segundos por delante podría significar saltar hasta 1280 kilobits — pero eso podría ser demasiado si la calidad se reduce dentro de esos diez segundos.

Esencialmente, no puede saber a dónde saltar en el archivo para comenzar a reproducirse en un código de tiempo específico, porque en lugar de ser una simple multiplicación, necesita conocer las tasas de bits de todo el audio que conduce a ese código de tiempo.

Hay maneras de evitar esto. Hace mucho, mucho tiempo, la gente creó una serie de estándares que permiten que los metadatos se incrusten en el MP3, lo que permite a los decodificadores averiguar dónde buscar. Podría escribir más sobre esto, pero es un punto discutible porque prácticamente nadie implementa el estándar.

Vale la pena señalar que la cantidad en la que el código de tiempo está desactivado aumenta a medida que avanza en el archivo. Al principio del archivo de audio, es poco probable que la calidad dejó mucho a todos, y la diferencia podría ser sólo unos pocos milisegundos. Sin embargo, después de unos minutos, eso crecerá en segundos. Después de una hora y más, puede crecer hasta un minuto o más.

Algunos podcasts son muy cortos. Considere El Palacio de la Memoria, que generalmente tiene episodios de menos de 15 minutos. Estaría más que sorprendido de escuchar que la búsqueda en un episodio de T. M. P. codificado en VBR estaba apagada por más de unos pocos puñados de segundos al final del archivo. (Mediría esto, pero es imposible hacerlo correctamente sin acceso al audio de origen raw)

Otros podcasts no requieren una función de búsqueda robusta. Los podcasts ASMR, los podcasts con poco diálogo o sin diálogo en absoluto, y los podcasts con parloteo sin sentido mientras los anfitriones, por ejemplo, juegan videojuegos, no necesitan la capacidad de buscar con precisión un código de tiempo en particular. Esta es una compensación que un número distinto de cero de podcasts está dispuesto a hacer.

La búsqueda relativa tampoco se ve afectada en gran medida por la codificación VBR. El podcast Mi hermano Mi hermano y yo usamos codificación VBR, y es posible saltar treinta segundos y retroceder diez segundos con muy buena precisión. Hay una buena razón para esto técnicamente: al igual que buscar desde el principio de un archivo, es poco probable que la calidad disminuya mucho durante el pequeño período de tiempo que está omitiendo. Saltar por delante treinta segundos podría significar en realidad saltar por delante, digamos, treinta y un segundos. La cantidad de inexactitud está determinada por la cantidad de audio que está omitiendo, que con la búsqueda relativa suele ser bastante pequeña.

VBR en realidad no hace que los archivos sean más pequeños.

Esto es a medias cierto. VBR producirá archivos de casi el mismo tamaño que CBR si la tasa de bits promedio del archivo VBR es la misma que la tasa de bits fija del archivo CBR. VBR también producirá archivos del mismo tamaño que un archivo CBR si nunca cambia la tasa de bits (es decir, el codificador nunca elige bajar la calidad, como con ruido aleatorio).

Excluyendo el caso en el que el archivo contiene solo ruido aleatorio (¿por qué está publicando eso en su podcast de todos modos?) la diferencia de tamaño tiene la obvia advertencia de que el archivo VBR tendrá una calidad de audio igual o mayor en general que el archivo CBR.

Considere esto: tienes un archivo de diez segundos. La primera mitad es casi silencio, y la segunda es música de alta fidelidad. Si codificamos esto como CBR a 128kbps, será 1280kb. Si lo codificamos como VBR, y el codificador codifica hipotéticamente la primera mitad a 64kbps y la segunda mitad a 192kbps, el tamaño del archivo seguirá siendo de 1280kb, y la tasa de bits promedio sigue siendo de 128kbps. Comparando la calidad, sin embargo, encontraremos que el archivo VBR suena mucho mejor, ya que el silencio está usando solo los bits que necesita y más bits se dedicaron a la música.

Al ajustar la configuración de su codificador, puede reducir efectivamente la tasa de bits promedio de su archivo codificado en VBR de manera que la calidad coincida aproximadamente con el archivo codificado en CBR equivalente. En teoría, esto conducirá a una reducción general del tamaño del archivo. Sin embargo, si elige la configuración de VBR sin saber lo que está haciendo, puede terminar fácilmente negando cualquier beneficio de tamaño de archivo que derivaría de usar VBR para empezar.

Los archivos VBR no muestran la duración correcta.

De forma predeterminada, no, la duración de un archivo VBR se calculará por su longitud de bytes, lo que resulta en una sobreestimación (por la misma razón que la búsqueda no funciona). Sin embargo, esto se soluciona fácilmente: simplemente especificando la duración del audio en las etiquetas ID3 utilizando un fotograma TLEN, se fijará la duración. Algunos decodificadores no leen correctamente el marco TLEN, pero son pocos y distantes entre sí y casi nunca se usan con las aplicaciones y dispositivos de los que alguien podría consumir un podcast.

Los codificadores como Adobe Audition generan archivos codificados con VBR rotos.

Esto es algo que encontré mencionado en línea en varios lugares, que se remonta a una publicación en los foros de Adobe. Sin leer los detalles, es fácil crear una nube de FUD en torno a este problema. Resulta que esto está directamente relacionado con la última afirmación sobre la duración: Audition simplemente no estaba (supuestamente) agregando los datos TLEN.Actualización

: Me gustaría tener en cuenta que no he podido reproducir este problema con Adobe Audition. Puede ser que existiera un problema en una versión anterior, pero ya no parece ser el caso. He actualizado esta sección para indicar de forma más explícita que no creo que haya un problema con Adobe Audition. Gracias a @audiblychuck en Twitter por comunicarte.

Argumentaría que esto es responsabilidad del podcaster, no un problema para el oyente. Es fácil agregar etiquetas ID3, y Audition no es el único caballo en esta carrera. Entre bastidores, Audition utiliza el codificador Fraunhofer MP3. La publicación en los foros de Adobe también se refiere a Audition CS6, lanzado en 2012; no me sorprendería si una versión más reciente solucionara el problema.

Incluso si Adobe no solucionó esto, numerosas publicaciones en Internet recomiendan herramientas (MP3val, MP3Diag, etc.).) que detectan y solucionan este problema. Tanto Ffmpeg como LAME agregan correctamente la etiqueta ID3 adecuada, lo que significa que la mayoría de los demás programas de edición de audio funcionarán correctamente de forma predeterminada.

Casi todos los decodificadores de MP3 modernos no requieren una etiqueta ID3 TLEN para determinar la duración correcta de un archivo MP3 VBR.

VBR no funciona con ciertos dispositivos.

Hay evidencia anecdótica para apoyar esto. Encontré un hilo de comentarios de HackerNews sobre el soporte para dispositivos. Aquí está el comentario de raíz de la discusión, hablando de una experiencia de hace más de una década:

Resulta que no todo el mundo está escuchando con un dispositivo moderno. Cuando probamos VBR, un número significativo de personas no pudo escuchar porque su hardware/software de reproducción de MP3 de su elección no era compatible con los archivos VBR correctamente. No se dieron cuenta de que este era el problema. Simplemente se quejaron de que el archivo estaba dañado mientras funcionaba bien para todos los demás.

Un comentarista tuvo un problema con su EigerMan F20:

Mi error favorito sobre esto fue en un reproductor de MP3 _ancient_ que tenía (un EigerMan F20), que soportaba MP3 VBR incompl de forma incompleta. No soportaba regiones de decodificación con ciertas tasas de bits, por lo que simplemente las saltaba silenciosamente, lo que me llevaba a una confusión extrema.

El EigerMan F20, en la foto con la friolera de 32 MB de almacenamiento flash

Otro comentarista tuvo mejor suerte con su máquina de discos Nomad 3:

Estoy bastante seguro de que mi Nomad Jukebox 3 es compatible con VBR, y eso viene a los 14 años.

Un usuario de hydrogenaudio tuvo mala suerte con un reproductor de DVD en 2006:

Mi reproductor de DVD (Samsung HD-860) no reproduce archivos mp3 vbr. Tiene aproximadamente 2 años e incluso viene con una salida HDMI.

Otro comentarista en el mismo hilo tuvo problemas con su coche:

Mi amigo compró un nuevo Pontiac G5 2008 (este es básicamente el Grand Am, pero desde entonces lo han renombrado a G5) y venía con una cubierta compatible con mp3-CD instalada de fábrica. La unidad reproducirá archivos VBR muy bien, pero hemos descubierto que todos los fotogramas en el mp3 deben codificarse a 128 kbps o superior.

No seguiré copiando y pegando publicaciones sobre coches y reproductores de MP3 de hace más de una década. ¡La mayoría de los dispositivos que la gente menciona ni siquiera podrían contener un episodio completo de podcast de 2017!

Mi investigación en el resto de la web arrojó resultados similares. No pude encontrar un solo informe de un dispositivo hecho en los últimos diez años que no pudo reproducir archivos VBR, y esto no me sorprende. Un reclamo no citado en Wikipedia afirma:

A partir de diciembre de 2006, los dispositivos que solo admiten archivos codificados con CBR son en gran medida obsoletos, ya que la gran mayoría de los dispositivos de música portátiles modernos y el software admiten archivos codificados con VBR.

Sin ninguna evidencia de lo contrario, no creo que la compatibilidad de dispositivos sea un argumento válido contra VBR.

Si ha tenido problemas de compatibilidad con VBR con un dispositivo, me encantaría saberlo. ¡Por favor, comunícate!

Firefox no es compatible con VBR.

Esto ya no es cierto. Firefox admite archivos VBR. Me probé tanto en macOS como en Windows 10. Firefox utiliza el decodificador de audio de la plataforma host para reproducir MP3 en lugar de incluir su propio decodificador de MP3. En Windows, el archivo supuestamente deja de reproducirse a mitad de la secuencia debido a los problemas de código de tiempo discutidos anteriormente. Este ya no parece ser el caso en absoluto. El archivo jugado bien, sin truncamiento y no buscar problemas.

Los profesionales dicen no usar VBR.

Me remitieron a las autoridades de un podcast y a otros profesionales de la industria para que me aconsejaran sobre por qué evitar VBR. Estaba interesado en los argumentos que esta gente presentó.Actualización

: En el momento de escribir, un error en el código de mi análisis identificó incorrectamente 15 podcasts en los 100 podcasts principales de iTunes como que usaban VBR. En realidad, solo uno usa codificación VBR. Este número fue citado en mi correspondencia con Rob Walch.

La primera persona con la que me dijeron que me pusiera en contacto es Rob Walch, que es el actual vicepresidente de relaciones con podcaster en Libsyn. Le envié un correo electrónico, y él respondió con un enlace a una publicación de blog. Aquí hay un fragmento de esa publicación:

VBR es una vieja tecnología / hack que fue creada para hacer archivos de música MP3 más pequeños y fue popular en el apogeo del uso compartido de archivos. Hoy en día no hay necesidad de ti, el ancho de banda y el almacenamiento disponibles en la actualidad son muy diferentes a los de hace 15 y 20 años. Pero lo más importante es que los estándares ISO para MP3 no requieren que los reproductores lo admitan.

De acuerdo con la norma (ISO/IEC 11172-3:1993), Sección 2.4.2.3

«Para proporcionar el menor retardo y complejidad posibles, no es necesario que el decodificador admita una tasa de bits variable continua en la capa I o II. La capa III admite la tasa de bits variable cambiando el índice de tasa de bits. Sin embargo, en formato libre, se requiere una tasa de bits fija.»

y

» Para la capa II, no se permiten todas las combinaciones de velocidad de bits total y modo.»

Por lo tanto, la mayoría de los codificadores de Capa II no habrían sido escritos con VBR en mente, y la Capa II VBR es un truco. Funciona para casos limitados. Conseguir que funcione en la misma medida que el VBR de estilo MP3 será un gran truco.

En resumen, el día en la luz y el uso masivo de VBR está muy atrás, a finales de la década de 1990 y antes del podcast.

Todos estos argumentos son los mismos que hemos cubierto anteriormente, con un puñado de excepciones. Por un lado, Rob afirma que el ancho de banda y el almacenamiento son baratos. Esto es cierto, pero la audiencia de podcast también se ha disparado en los últimos años (incluso desde su publicación en 2014). A nivel internacional, especialmente en los mercados emergentes, el ancho de banda es costoso para el oyente, lo que puede ser una barrera para aumentar la audiencia fuera de los Estados Unidos.

También cita la especificación ISO MPEG, pero las citas que extrae son malinterpretadas. MP3 significa «MPEG-2 Audio Layer 3», por lo que la cita «Layer III admite tasa de bits variable cambiando el índice de tasa de bits» significa realmente «MP3 admite tasa de bits variable».»A mi entender, no puedes ser compatible con MP3 y no admitir VBR (según las especificaciones). La segunda cita sobre «Capa 2» se refiere a la Capa de audio MPEG-2 2, que es un códec completamente diferente del MP3 y es irrelevante para la discusión.

Respondí con estos comentarios, preguntando si tenía datos para ayudar a corroborar estas afirmaciones. La respuesta que recibí fue un poco salty salada.

Matt,

Honestamente, el título del artículo lo dijo todo, la primera y última palabra en VBR.

VBR está muerto, cualquiera que lo presione solo está luchando contra molinos de viento.

CBR = bueno

VBR = malo

Realmente es así de simple, no intente sacar más provecho de esto, VBR NO es totalmente compatible con los reproductores y los estándares.

Si está tratando de presionar por VBR, eventualmente mirará hacia atrás en este correo electrónico y deseará haberme escuchado. 🙂

y seguido rápidamente por

Hola Matt,

Si estaba pensando en usar VBR o está usando VBR y después de leer mi artículo no está convencido de cambiar — necesita leer realmente esto:

http://theoatmeal.com/comics/believe

Hay una amarga ironía en su respuesta, que te dejaré encontrar mientras lees la fina tira de Matthew Inman sobre el efecto contrapunto. Le presioné de nuevo para que me diera detalles, y recibí otra respuesta fría:

Buena suerte en tu búsqueda.

Considero que VBR es un problema muerto y pongo los ojos en blanco cuando surge. Que es la razón de la publicación que hice.

Parece que cada dos años levanta su fea cabeza.

No estoy seguro de qué 15% viste, la última vez que revisé top muestra que era 0%

http://podcast411.libsyn.com/will-increasing-your-bit-rate-equal-more-listeners

Ver este post.

En este punto, es mi última respuesta en VBR.

Demasiado que hacer para perder tiempo en esto: la publicación que hice te da toda la información que necesitas si la miras objetivamente.

Realmente te recomiendo que pases a CBR y no tendrás ningún problema.

La publicación vinculada solo repite el mantra de Rob: «VBR = malo.»Sin señalar hechos objetivos para respaldar las afirmaciones que hace, no puedo decir que las opiniones de Rob sobre el asunto tengan mucha agua.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.