Musik
Bei der Verwendung und Verarbeitung von Musik aus digitalen und analogen Quellen kommt es zu vielen Fragen, Problemen und Fußangeln. Wie bekomme ich möglichst viel Musik in guter Qualität auf meine mp3-player? Was ist die beste Methode um Musik zu archivieren? Welche Formate gibt es? Was ist DRM? Welchen Player soll ich mir kaufen? Wie komme ich von der Audio-CD zur mp3-Datei? Welche CDs darf ich kopieren?
Alle hier erwähnte Programme sind auf der Software-Seite verlinkt. Soweit ich weiß, sind die Programme kostenlos und frei benutzbar. Jedenfalls, was mein Verständnis der englischen und deutschen Sprache angeht.
Inhalt dieser Seite:
- Grundlagen
- Formate
- Encoder
- tag
- Dateinamen
- Bitraten
- Audio-CDs auslesen (und in OggVorbis, mp3, usw umwandeln)
- OggVorbis-Dateien erstellen
- mp3-Dateien mit LAME erstellen
- Formatumwandlungen
Die Grundlagen
Zur Zeit gilt noch die CD als Quelle hochwertiger Musik. Zwar stehen Super-Audio-CD und DVD-Audio in den Startlöchern, jedoch sind die Kunden aus verständlichen Gründen nicht bereit mehr als 15EUR für ein Album zu bezahlen. Die CD ist also momentan das Nonplusultra an Klangqualität. Somit werden alle anderen Formate, die sich aus der Umwandlung von Audio-CDs ergeben am Klang der CD gemessen.
Wie kommt die Musik auf die CD?
Bis jetzt ist, soweit mir bekannt, noch nieman in der Lage digital zu singen. Elektronische Musik wird digital erzeugt, und erspart sich somit die Umwandlung von analog nach digital. Zu allererst haben wir also ein analoges Signal. Um dieses dieses Musiksignal auf eine CD zu bekommen, muß es digitalisiert werden, also in diskrete Werte bestehend aus Nullen und Einsen transferiert werden. Man geht davon aus, daß der Mensch Töne bis max. 20kHz hören kann. Will man ein Signal mit 20kHz eindeutig digitalisieren, muß man mindestens mit der doppelten Frequenz abtasten, um das Nyquist-Kriterium zu erfüllen. Deshalb arbeitet die CD mit einer Samplingrate von 44,1kHz. Das bedeutet, daß das Audiosignal 44100mal pro Sekunde gemessen und der Wert in binärer Form niedergeschrieben wird. Wie genau dieser Wert ausfällt, hängt von der Samplingtiefe ab. Die CD arbeitet mit 16bit. Es gibt also 216 Möglichkeiten. (Immer bedenken, daß sich die Anzahl der Möglichkeiten mit der Steigerung um eine Potenz verdoppelt (216 = 215 x 2). Da die CD mit getrennten Stereokanälen arbeitet werden die Signale für die beiden Seiten als eigene Signalspur aufgezeichnet. Die Daten auf einer CD entsprechen also einer Wave (*.wav) im Format 44,1kHz, 16bit, Stereo. Da bedeutet eine Bitrate von ca. 140kByte/s (=1120kBit/s). Das entspricht der 1x Geschwindigkeit eines CD-(ROM)Laufwerks. Damit kommen für ein vier minütiges Musikstück gut 50MB zusammen. Wozu mit so großen Datenmengen handieren, wenn wir ohnehin nicht alles hören, was in den Daten enthalten ist. Hier setzen die verlustbehafteten Kompressionsverfahren an.
Komprimieren, aber wie?
Wer schon mal versucht hat eine Wavedatei in ein ZIP-Archiv zu packen ist mit der Kompressionrate nicht zufrieden gewesen. Durch einfach Subtition läßt sich dabei nicht viel machen. Subtition bedeutet das Ersetzen eines sich wiederholenden Informationsblocks durch ein kürze Zeichenkette. Textdateien lassen sich besonders gut auf diese Art komprimieren (Warum?). Es gibt für Musik wie auch für Bilder zwei grundsätzlich verschiedene Methoden: verlustfrei und verlustbehaftet.
Ohne Verluste
Nach einer verlustfreien Kompression lassen sich aus dem Ergebnis wieder die originalen Daten herstellen. Dafür muß man in Kauf nehmen, daß die Kompressionsraten nicht so hoch sind, bei Musik bei ca. 50% liegen. Ein sehr guter, schneller, verlustfreier Encoder (Komprimierer) ist Monkey’s Audio. Ein weiterer Codec zur Kompression ohne Verluste ist FLAC. Damit hätten wir eine Audio-CD von 650 auf 300MB gebracht. Prima für’s Archiv, schlecht für unterwegs.
Ausmisten
Nehmen wir einmal an, wir stehen auf einem Bahnhof und ein Zug fährt ein. Dabei geht das Geschrei des kleinen Kindes in 20m Entfernung vollkommen unter. Warum sollen wir das Geschrei also mit aufnehmen bzw. digitalisieren? Der Zug ist lauter als alles, also behalten wir nur die Daten für den Zuglärm. Der Rest wird verworfen. Wir haben verlustbehaftet komprimiert, z.B. mit mp3. Auf einem Foto steht im Vordergrund ein Topmodel. Im Hindergrund in weiter Entfernung der Horzizont in verschiedenen Blautönen. Uninteressant für Darstellung der Kurven / des Waschbrettbauches (für die Frauen
). Weg damit. Alles mehr oder weninger ein Blau. Wir haben verlustbehaftet komprimiert, z.B. mit JPEG. Es ist also klar, daß man mit verlustbehafteter Kompression wesentlich höhere Verkleinerungsfaktoren erreichen kann. Allerdings nimmt man in Kauf auf Daten zu verzichten. Aus einer auf diese Art komprimierten Datei kann nie mehr das Original rekonstruiert werden. Für die Praxis bedeutet dies, dass aus MP3s erstellte Audio-CDs nicht besser klingen können als das MP3. Hier entscheidet der Qualitätsfaktor oder die Bitrate über das Ausmaß dieser Ausdünnung. Aber, wer entscheidet denn was da rausfliegt? In der Musik verwendet man dazu sog. Psychoakustische Modelle. Man läßt also duzente von Testpersonen probehören. Daraufhin wird die Algorithmus, also das Kompressionsverfahren, angepasst.
Von der CD zur Datei
Der Weg von der Audio-CD zur komprimierten Datei führt über folgende Stationen:
Audio-CD -> Ripper -> Wavedatei -> Encoder -> komprimierte Datei
Das wichtig, um zu verstehen, wie untschiedliche Programmpakete mit den Daten umgehen. Wichtig ist auch sich mit DRM und Urheberechten auseinander zu setzen.
Kopierschutz
Welche CDs kopiert bzw. ausgelesen (gerippt) werden dürfen, erfahrt Ihr auf dem von der Regierung geförderten Portal irights.info. Ich beschreibe hier nur den technischen Hintergrund. Grundsätzlich gilt, daß von kopiergeschützen CDs keine Kopien oder ausgelesen Dateien existieren dürfen. Wäre dem, hätte man illegaler Weise den Kopierschutz geknackt. Da kopiergeschützte CDs ohnehin nicht mehr der CD-Audio Standard entsprechen, sonder eigentlich eher CD-ROMs sind, kann es beim Abspielen zu Problemen führen. So versuchen mp3-fähige Autoradios die preparierten Datenspuren solcher CDs zu lesen. Dabei verhaspeln sie sich genauso wie CD-ROM-Laufwerke im PC. Zusätzlich verändern manche Kopierschutzmechanismen die Korrekturdaten (C2) von Audio-CDs. Dadurch werden zerkratzte CDs schneller unbrauchbar. Wer also auf gute Musik in guter Qualität Wert legt, kauf nur Audio-CDs, d.h. CDs ohne Kopierschutz. Amazon.de gibt zu jeder CD an, ob ein Kopierschutz vorhanden ist. Die c’t führt ein Un-CD-Register, indem Nicht-Audio-CDs mit Musikinhalt gelistet werden. So kann man verhindern, daß CDs dann sich dann in manchen Playern nicht abspielen lassen.
DRM
Wie verhindert man, daß die aus Onlinestores gekauften Lieder nicht in Tauschbörsen auftauchen? Der Großteil der Musikindustrie greift zu DRM. DRM steht für Digital Rights Management. Ich werde mich dazu getrennt auslassen. Letztendlich geht es darum zu bestimmen, was der Kunde mit der käuflich erworbenen Musik anstellen darf. Musikformate, die DRM von Haus aus nicht unterstützen, sind daher der Musikindustrie ein Dorn im Auge. Dabei gibt eine viel vernünftigere Art der Kontrolle: Wasserzeichen. Die in Musikstücke eingebrachten Wasserzeichen lassen sich selbt nach sämtlichen Umwandelaktionen nicht aus dem Stück entfernen. Das so beim Kauf dem Käufer zugeordnetem Wasserzeichen, würde sofort verraten, wer das gute Stücke verbreitet hat.
Die Formate
Auf das Format kommt es an. Ein brauchbares Musikformate muß folgende Punkte erfüllen: Guter Klang, hohe Kompatibilität, Zukunftssicherheit, kleine Dateigrößen. Was nützt eine Musiksammlung im XY-Format, wenn man diese auf anderen Systemen nicht wieder geben kann? Was macht man mit einer Sammlung im XY-Format, das man in 10Jahren nicht mehr wieder geben kann. Und natürlich für alle mit Verstand: Das Format sollte dem Nutzer alle Freiheiten lassen mit der Musik, die er ja käuflich erworben hat, anzustellen was er will. Außerdem sollte das Format frei von Patenten und der Willkür von Großkonzernen sein. Damit scheidet z.B. das WMA-Format von vornherein aus. WMA ist ein proprietärer, von Microsoft entwickelter Algorithmus, der DRM massiv untertützt. Es bleiben aus Fülle von Formaten (AAC, mp3-plus, …) zwei übrig: mp3 und OggVorbis.
- “MP3-Nachfolger im c’t-Hörtest“, c’t, 19/02 (kaufen)
- OggVorbis Hörproben, vorbis.com
- Ogg vs. mp3 vs. WMA vs. RealAudio, Vergleichstest bei niedrigen Bitraten
- Die Welt nach MP3, CHIP, 11.2003
Was zum Teufel ist OggVorbis?
OggVorbis (*.ogg) ist ein hocheffizienter, sehr gut klingender, patentfreier Codec (Algorithmus) zur verlustbehafteten Komprimierung von Audiodateien. OggVorbis setzt von grundsätzlich auf variable Bitraten. Mehr dazu später. OggVorbis erzeugt bei gleicher Dateigröße besser Klangergebnisse als mp3, und bei gleicher Klangqualität kleinere Dateien. mp3 ist mittlerweile 10Jahre alt. Ein ganz erhebliches Alter in der IT-Welt. Das Patent für das vom Fraunhofer Institut entwickelte mp3-Format wird zurzeit von Thomson gehalten. Thomson könnte also alle Hersteller von mp3-Player, mp3-Encodern und Anbieter von mp3-Dateien zur Kasse bitten. Tut es aber nicht. OggVorbis ist also DIE Wahl für ein Musikformat. Allerdings hat dauert es immer mehrer Jahre bis der ganze Haufen von enthusiastischen Vollprofis überhaupt mitbekommt, daß es etwas neues auf dem Markt gibt. Jeder moderne Medienspieler (wie z.B. WinAmp) spielt OggVorbis problemlos ab. Daß der Windows MediaPlayer OggVorbis nicht abspielt, überrascht nicht. Ein freies Format ohne DRM will man nicht. Mit dem OggVorbis Plugin für Nero können problemlos Audio-CDs erstellt werden. Wer sich Nero nicht leisten kann, nimmt Burn-At-Once. Das erstellt ebenfalls Audio-CDs On-The-Fly aus vielen Musikformaten. Es gibt mittlerweilen schon etliche portable Abspielgeräte, die OggVorbis können. Und gerade hier ist OggVorbis gewünscht: Möglichst viel Musik auf möglichst wenig Raum.
Die Encoder
Die Encoder für OggVorbis greifen alle auf die OggVorbis Tolls zurück. Entweder rufen sie direkt die Programme auf oder bedienen sich einer Programmbibliothek (*.dll). Bei mp3 gibt es ein Vielzahl von Encodern. Zwar erstellen alle mp3 Dateien, jedoch nicht in gleich guter Qualität. Einige Encoder kosten auch Geld. Der Encoder des Frauhofer Institutes findet in MusicMatch-Jukebox seine Verwendung. Im Vergleichstest schneidet der freie Encoder LAME am besten ab. LAME = Lame Ain’t a MP3 Encoder. LAME ist also kein Encoder, sondern offiziell nur ein Studienproject, um Patentstreitigkeiten zu umgehen. Aus der Version 3.90.x mußt eine Komponente entfernt werden. Erst ab Version 3.96.1 liefert LAME wieder sehr, sehr gute Ergebnisse bei schneller Kompressionsgeschwindigkeit. Ein mit LAME nach VBR-Manier codiertes mp3 kann einem aktullen ogg fast das Wasser reichen.
Der tag
mp3 wie auch OggVorbis Dateien besitzen die Möglichkeit einem tag Informationen über das Musikstück zu speichern: Künstler, Titel, Album, Genre, Jahr, Kommentar. Die meisten Player (Soft- und Hardware) können diese tags auslesen und anzeigen. Bester tag-Bearbeiter ist MP3tag. Das Programm ist sogar in der Lage anhand der Länge der Musikstücke auch ohne Musik das passende Album aus der free-DB heraus zusuchen, und die Lieder damit zu taggen.
Dateinamen
Jeder Mensch sortiert anders. Aber manche Schemen machen mehr Sinn als andere; unabhängig von der Sortierung nach Genre, Jahren, usw. Ich schlage für Verzeichnisse folgendes vor:
Künstler - Album (Jahr), z.B. Pink - Missundaztood (2002)
Für die Namen der einzelnen Tracks macht folgendes Schema Sinn:
Tracknummer - Trackname von Künstler, z.B. 09 - Misery von Pink
Warum? Ganz einfach: Das Display der meisten mp3-Player zeigt nur eine begrenzte Zeichenfolge an, und danach muß man warten bis die Schrift durch gescrollt ist. Das Problem wird hierbei deutlich:
01 - Red Hot Chili Peppers - Greatest Hits - Under The Bridge
Viel Spaß beim Warten bis der Liedtitel dann endlich auf dem Display erscheint. Die kompletten Informationen zeigen die meisten Player dann beim Abspielen des Liedes an. Dafür lesen sie den tag aus. Tags und Dateinamen lassen sich bequem mit MP3tag bearbeiten und ineinander konvertieren.
Bitraten
Je höher die Bitrate, desto mehr Information, desto besser der Klang. Da man aber meistens nicht unbegrenzt Platz zur Verfügung hat, soll bei möglichst geringer Bitrate der Klang möglichst gut sein. Hohe Frequenzen wegschneiden. Da Eure versifften Ohren ohnehin im Umgebungslärm unterwegs keine Töne über 17kHz hören, werden diese mit einem Tiefpass einfach weggeschnitten. Je höher die Frequenz, desto mehr Informationsinhalt. Deshalb erstpart man sich dadurch schon viel Platz, und mach dem Encoder das Leben leichter.
Brauchen wir wirklich Stereo, also einen separaten Kanal für beide Seiten? Nein, wir sparen Platz, und codieren mit Joint-Stereo. Wir speichern also nur die Unterschiede beider Kanäle. Den Unterschied merkt keiner.
Welche Bitrate ist die beste? Kommt darauf an, ob man sich ein Klassik-Archiv anlegt, oder stupides Popgedüdel unterwegs hört. Es gibt folgende 3 Modi für’s Kodieren mit moderenen Encodern:
- CBR (constant bitrate): Die Bitrate wird vorgeschrieben. Der Encoder hat keine Möglichkeit sich an die Bedürfnisse des Stücks anzupassen. Dateigröße ist kalkulierbar.
- ABR (average bitrate): Wir wollen am Ende ein durchschnittliche Bitrate. Der Encoder darf sich bei Klangumfang eine höhrer Bitrate nehmen. Bei geringerem Bedarf ist die Bitrate auch geringer. Jedoch am Ende soll der Durchschnittswert erreicht werden. Dateigröße bleibt kalkulierbar. Der Encoder ist aber immernoch eingeschränkt. Wieso soll hier ein Housestück aus drei Accorden gleichberechtigt mit den Brandenburgischen Konzerten von Bach abgehandelt werden?
- VBR (variable bitrate): Wir schreiben eine Qualitätsstufe vor. Dem Encoder bleibt die Verwirklichung überlassen. Die Dateigröße kann abhängig vom Klangumfang erheblich variiren. Der Encoder hat die Freiheit bei Stille auf die niedrigste Bitrate abzufallen. Warum soll man Stille auch mit 192kBit/s vergolden?
Audio-CDs auslesen
Bevor es ans Auslesen geht, muß man sich versichern, ob man das auch darf (siehe Kopierschutz). Audio-CDs sind keine CD-ROMs. Deshalb werden die Daten auch nicht einfach als Datei kopiert, sonder müssen im CD-DA (Compact Disc - Digital Audio) Modus ausgelesen werden. Ältere Laufwerke können das nur schlecht oder gar nicht. Dafür benötigt man einen CD-Ripper. Auf manchen Windowssystemen benötigt man den ASPI-Treiber von Adaptec. Für Anfänger empfehle ich den dMC-MusicConverter. Dieser hat einen CD-Ripper dabei. Damit lassen sich ohne viel Konfiguriererei gute Ergebnisse erzielen. Profis benutzen Exact-Audio-Copy. Bei beiden Programmen gilt es bei mp3 auf VBR zu setzen und sich ein sinnvolles Schema für die Dateinamen zu überlegen (siehe oben).
Anleitungen:
- mp3s, oggs erstellen mit dMC, einfach, schnell, gut
- mp3s, oggs erstellen mit EAC, für Profis bei MPEX.net
OggVorbis Dateien erstellen
Zum Ausprobieren der Verschiedenen Einstellungen von OggVorbis bieten sich OggDrop und OggDropXPT an. Beide Programme zeigen ein kleines Kästchen auf welches man die Wavedateien einfach fallen lassen kann. Das Komprimierte OggVorbis-File befindet sich nachher im selben Verzeichnis, wie die Wavequelldatei.
Fortgeschrittene benutzen die OggVorbis Tools auf der Kommandozeile. Einfachster Befehl:
oggenc datei.wav
Damit wir den Encoder oggenc nicht in jedes Verzeichnis ablegen müssen, in dem wir arbeiten, kommt er in ein zentrales Verzeichnis und wird per Pfad ansprechbar (Pfadfinder). Um ohne Umwege in jedem beliebigen Verzeichnis eine Kommandozeile (”DOS-Fenster”) installieren wir die Powertoys. Mit oggenc -help zeigt die Optionen an. Aber keine Angst, wir bauen erstmal den Standardbefehl von oben aus. Mit dem Schalter “q” wird die Qualität bestimmt. Je kleiner q, desto schlechter die Qualität. Voreingestellter Standard ist 3. OggVorbis arbeitet nicht mit Bitraten, sondern mit Qualitätsstufen. Macht bei Variablen Bitraten mehr Sinn. q 2 entspricht ca. 128kBit/s.
oggenc -q 2 datei.wav
Wir codieren ein Hörbuch, und brauchen nur Mono und keine 44,1kHz:
oggenc -q 0 --downsample --resample 32000 datei.wav
Um aus der OggVorbis Datei wieder eine Wave-Datei zu erhalten, rufen wir den Decoder auf:
oggdec datei.ogg
Mit ogginfo datei.ogg erfahren wir mehr über die OggVorbis Datei.
Um direkt von der Audio-CDs zu OggVorbis-Dateien zu kommen, müssen wir einen Ripper bemühen (Anleitung).
mp3 Dateien erstellen mit LAME
Bei den oben vorgestellten mp3-Encodern hat LAME am besten abgeschnitten, und ist auch noch kostenlos. LAME kommt als Programme lame.exe für die Kommandozeile oder als Bibliothek lame_enc.dll daher. Die Bibliothek ermöglicht ein Codieren On-The-Fly. Die mp3s werden also direkt aus den Daten der Audio-CD erstellt ohne die Zwischenstufe einer Wave Datei. Nachteil: schlechter anpassbar, das Auslesen dauert so lange wie das Codieren. Dadurch kann man nicht eine CD nach der anderen einlegen, und einen Kaffee trinken währen LAME sich dann mit den Wave Dateien vergnügt. Genau wie bei den OggVorbis Tools sollte sich die lame.exe in einem zentralen Verzeichnis befinden, und so von Überall aufrufbar sein. Alle Optionen gibt’s mit lame --longhelp. Unser erstes VBR-codiertes mp3:
lame --vbr-new datei.wav
Hierbei wählt LAME die Standardqualitätstufe 4. Anders als bei OggVorbis gilt für die Qualitätstufen von LAME: Je größer die Zahl, desto schlechter die Qualität. Für gute portable Qualität von Rock und Pop codieren wir in der Stufe 5:
lame --vbr-new -V5 datei.wav
Die Skala reicht bis 9. Wer ganz wenig Platz oder schlechte Ohren hat, kann auch auf Stufe 7 runter gehen. Für ein Hörbuch codieren wir mit der Voreinstellung für Sprachaufzeichnungen:
lame --vbr-new --preset voice datei.wav
Neben voice bietet lame noch eine Menge anderer vorgefertigter Profile; aufrufbar mit lame --preset help. Will man z.B. mit ABR bei 160 codieren, lautet der Befehl
lame --vbr-new --preset 160
Die Qualität und Dateigröße von
lame --preset standard datei.wav
ist keineswegs Standard, sondern extrem hoch und sind für heute Massenspeichergrößen dennoch leicht zu schlucken. Erste Wahl für rockige Musik. Klangfanatiker benutzen für Ihr Klassik-Archiv
lame --preset insane datei.wav
Manche mp3-Player können nur mit einer bestimmten Bandbreite bei VBR codierten Stücken umgehen, z.B. VBR-75 erlaubt max. 75% Abweichung vom Durschnittswert. Für solche Player bietet sich ABR an. Manche Stücke bewegen LAME zu Ausreißern. Ein unteres Limit für die Bitrate setzt “b”:
lame -h --vbr-new -V5 -b64 datei.wav
Die Untergrenze von 32kBit/s ist durch den mp3-Standard vorgeschrieben. Die Verwendung einer oberen Grenze mit “B” sollte man tunlichst unterlassen. Selbst bei geringen Bitraten kommen durch das Bitreservoir Frames mit viel höheren Bitraten vor. Verhindert man diese, klingt’s Scheiße. Man muß natürlich nicht alles per Hand auf der Kommandozeile machen. Das grafische Frontend RazorLAME kennt viele Voreinstellungen, und erlaubt das Codieren per Mausklick.
Um einfach von einer Audio-CD zum mp3-Album zu kommen, benutzt man einen Ripper.
Formatumwandlungen
Es macht überhaupt keinen Sinn mp3-Dateien in OggVorbis umzuwandeln, um in den Genuß besserer Klangqualität zu kommen. Letztendlich muß dazu das mp3 in eine Wave-Datei decodierte werden. Nicht vergessen, daß verworfenes Material sich nicht wieder herstellen läßt. Das Musikstück könnte maximal die gleiche Qualität erhalten wie die Quelldatei, niemals besser, eher schlechter. Es macht aber Sinn die Musik in ein Format umzuwandeln, welches der eigene mp3-Player versteht. Für Formatumwandlungen jeglicher Art bietet sich der dMC-MusicConverter an. Der wandelt fast alle Formate ineinander um. Aber nur, wenn diese nicht mit DRM geschützt sind oder die Lizenz vorliegt. Wer mit Platzproblemen auf seinem Player kämpft, kann auch in niedrigere Bitraten konvertieren. Angenommen die 192er mp3s passen nicht auf den Player. Dann codieren wir einfach in einen niedrigere Bitrate mit VBR um:
lame -h --vbr-new --mp3input -V6 datei.mp3