Sync-Wahnsinn treibt mich noch in den Wahnsinn. ;-)

  • Hallo zusammen.


    Hatte jetzt eine längere Abwesenheitsphase hier in dem Forum, aber auch zum Thema Youtube generell.
    Aber jetzt hab ich seit einiger Zeit wieder gefallen daran gefunden und beschäftige mich wieder vermehrt mit dem Thema.


    Ich weiß auch dass es schon einige Beiträge zu dem Thema hier im Forum sowie im weltweiten Web gibt. Ich hab auch schon einiges an Seiten gelesen, sowie Videos geschaut um mir Hilfe zu verschaffen, aber ich bin bisher nicht auf die Lösung gekommen. Irgendwo habe ich wohl einen Denkfehler.


    Jetzt habe ich gestern mein erstes langes LP aufgenommen (ca. 1,5 Std.) aber beim Editieren bin ich leicht am verzweifeln. ;)
    Mein Problem ist die Synchronität bei 2 Video und 3 Tonspuren.
    Kurz zum technischen Aspekt:


    Mein PC ist ein I5-6600K mit, ich glaube 2,8Ghz, 16GB Ram und einer Radeon Graka (290er Baureihe).
    Aufgenommen wird Gameplay und Facecam auf eine mit 7200U/min drehenden Festplatte mit genug Leistung laut eines Beitrags, den ich hier mal gelesen hatte.
    Audacity nimmt momentan auf die System SSD auf. (Das dürfte aber keine großen Probleme machen, oder liegt hier schon der Hase begraben?)


    Gaming-Video aufgenommen von der PS4 über die Elgato HD60 mit 59,94fps im hauseigenen Programm von Elgato.
    Facecam-Video aufgenommen von der Logitech 920 über OBS mit 29,97fps.
    Mikrofon aufgenommen über Audacity.


    Ich habe die ganze Frame/Bildwiederholraten-Thematik so verstanden, dass es technisch von der PS4 ja nicht möglich ist mit glatten 60fps aufzunehmen. Also macht es ja für mich Sinn, die Facecam, da 60fps nicht möglich sind mit einem Faktor von dem Hauptvideo (PS4 mit 59,94fps) aufzunehmen. In diesem Fall exakt die Hälfte.
    Ich bekomme alles dann auch mit großer Mühe in Premiere synchronisiert. Entweder über die Sync-Funktion oder eben per Hand die Spur ans Bild angepasst. Um das Ganze zu synchronisieren, nutze ich, wie so viele die Klatsch-Methode um eben den Peak für die vereinfachte Zuordnung zu haben. Soweit so gut.


    Aber egal was ich mache, an irgendeiner Stelle des Videos läuft es dann aus der Sync. Welche Einstellung übersehe ich? Gibt es einen ähnlichen Wert für die reine Mikro-Audiodatei (frames-ähnlich) den ich angleichen müsste?


    Wenn ich alles in Premiere lade, richte ich meine Sequenz am Gameplay, also den 59,94fps aus. Danach synchronisiere ich zuerst das Mikro an der Facecam und danach passe ich das Gameplay an. Meine Aufnahme ist jetzt schon im Kasten und ich muss versuchen mit dem Asynchronen klar zu kommen, aber für zukünftige Aufnahmen gibt es ja bestimmt eine Möglichkeit um das Ganze zu vereinfachen oder? Gib mir bitte einer den zündenden Ideen-Funken. Mein Kopf raucht sonst noch ungebildet und dumm ab. :D


    Jeder Hinweis zu dem mir fehlenden Puzzle-Teil ist herzlich willkommen.


    Gruß, Hohmer.

  • Soweit ich weiß, kann erst die neueste Version von Premiere mit variablen Frameraten umgehen, und ich wette einen Euro, dass sowohl deine Webcam als auch dein PS4-Material nicht wirklich konstant laufen. ;) Das lässt sich relativ einfach mit Mediainfo herausfinden.

  • Hi Julien.


    Okay, Mediainfo hab ich mir mal geladen. Meinst du die Gesamtbitrate? Da steht, variabel. Oder welchen Wert muss ich suchen? Aber ja, ich denke auch, dass Premiere das normalerweise können sollte. ;)
    Was ich noch vergessen habe. Die Gameplay-Datei hat eine Länge von 2:12:50. Ich habe, nachdem ich alles zu Beginn des Videos synchron bekommen habe, habe ich zum Schluss einen Versatz von 14 Frames gehabt zur Audio-Datei des Mikros.


    Ich weiß nicht, ob diese Information hilfreich ist? Gibt da ja gewisse Faktoren / Multiplikatoren an denen man Einstellungsfehler in den Frames, usw festmachen kann.


    Gruß, Hohmer.

  • Die interessanten Werte sind die über die Bildwiederholrate. ;) Am besten stellst du die Ansicht von Mediainfo auf Text um und kopierst die Inhalte der verschiedenen Aufnahmedateien hier rein, dann wissen wir genau, mit was wir es zu tun haben.

  • Okay, hier mal noch schnell die harten Fakten bevor ich auf die Arbeit mache...


    Gameplay:
    Format : MPEG-TS
    Dateigröße : 41,1 GiB
    Dauer : 2 h 12 min
    Modus der Gesamtbitrate : variabel
    Gesamte Bitrate : 44,3 Mb/s


    Video
    ID : 100 (0x64)
    Menü-ID : 2 (0x2)
    Format : AVC
    Format/Info : Advanced Video Codec
    Format-Profil : High@L4
    Format-Einstellungen : CABAC / 2 Ref Frames
    Format-Einstellungen für CABAC : Ja
    Format-Einstellungen für RefFrames : 2 frames
    Format_Settings_GOP : M=2, N=14
    Codec-ID : 27
    Dauer : 2 h 12 min
    Breite : 1 920 Pixel
    Höhe : 1 080 Pixel
    Bildseitenverhältnis : 16:9
    Bildwiederholungsrate : 59,940 (60000/1001) FPS
    ColorSpace : YUV
    ChromaSubsampling/String : 4:2:0
    BitDepth/String : 8 bits
    Scantyp : progressiv
    colour_range : Limited
    colour_primaries : BT.709
    transfer_characteristics : BT.709
    matrix_coefficients : BT.709


    Audio #1
    ID : 101 (0x65)
    Menü-ID : 2 (0x2)
    Format : AAC LC
    Format/Info : Advanced Audio Codec Low Complexity
    Format-Version : Version 4
    Muxing-Modus : ADTS
    Codec-ID : 15-2
    Dauer : 2 h 12 min
    Bitraten-Modus : variabel
    Kanäle : 2 Kanäle
    Channel layout : L R
    Samplingrate : 48,0 kHz
    Bildwiederholungsrate : 46,875 FPS (1024 SPF)
    Video Verzögerung : 6 ms
    Sprache : Deutsch


    Facecam:
    Format : MPEG-TS
    Dateigröße : 20,2 GiB
    Dauer : 2 h 12 min
    Modus der Gesamtbitrate : variabel
    Gesamte Bitrate : 21,8 Mb/s


    Video
    ID : 256 (0x100)
    Menü-ID : 1 (0x1)
    Format : AVC
    Format/Info : Advanced Video Codec
    Format-Profil : [email protected]
    Format-Einstellungen : CABAC / 4 Ref Frames
    Format-Einstellungen für CABAC : Ja
    Format-Einstellungen für RefFrames : 4 frames
    Codec-ID : 27
    Dauer : 2 h 12 min
    Breite : 1 920 Pixel
    Höhe : 1 080 Pixel
    Bildseitenverhältnis : 16:9
    Bildwiederholungsrate : 29,970 (30000/1001) FPS
    Standard : Component
    ColorSpace : YUV
    ChromaSubsampling/String : 4:2:0
    BitDepth/String : 8 bits
    Scantyp : progressiv
    colour_range : Limited


    Audio
    ID : 257 (0x101)
    Menü-ID : 1 (0x1)
    Format : AAC LC
    Format/Info : Advanced Audio Codec Low Complexity
    Format-Version : Version 4
    Muxing-Modus : ADTS
    Codec-ID : 15-2
    Dauer : 2 h 12 min
    Bitraten-Modus : variabel
    Kanäle : 2 Kanäle
    Channel layout : L R
    Samplingrate : 44,1 kHz
    Bildwiederholungsrate : 43,066 FPS (1024 SPF)


    Mikro-Audio:
    Format : Wave
    Dateigröße : 1,31 GiB
    Dauer : 2 h 12 min
    Modus der Gesamtbitrate : konstant
    Gesamte Bitrate : 1 411 kb/s


    Audio
    Format : PCM
    Format-Einstellungen : Little / Signed
    Codec-ID : 1
    Dauer : 2 h 12 min
    Bitraten-Modus : konstant
    Bitrate : 1 411,2 kb/s
    Kanäle : 2 Kanäle
    Samplingrate : 44,1 kHz
    BitDepth/String : 16 bits
    Stream-Größe : 1,31 GiB (100%)


    Gruß, Hohmer.

  • Ich bin fasziniert, die Frameraten sind wirklich komplett konstant! 8o Was mir dafür aber auffällt, ist die Samplerate der jeweiligen Tonspuren – zweimal 44,1 kHz und einmal 48,0 kHz. Das könnte auch ein Grund für das Auseinanderdriften sein, also die am besten angleichen, wenn möglich.

  • Schönen guten Morgen.


    Klingt natürlich nach einem guten Verdacht. Allerdings hab ich das zum Gaming-Material noch gar nicht gegengeprüft. Mir ist es bei facecam und Mikro-Tonspur aufgefallen was die Theorie mit der Samplerate leider wieder zunichte macht. ;( Werde aber trotzdem alles auf 44,1kHz angleichen.


    Das nur am Rande bemerkt. Habe im Netz dazu auch noch keine Lösung gefunden. Elgato nimmt bei mir auch immer einen Arsch voll Tonspuren unnötigerweise mit auf, aber ich gehe mal davon aus? das wird man in dem Elgato-Programm nicht lösen können oder kennt jemand eine Lösung zu dem kleinen „Problem“!? ;)


    Gruß, Hohmer.


    Edit sagt:
    Was mir jetzt auch noch aufgefallen ist, nachdem ich die Daten hier nochmal durchgelesen habe. Es gibt ja doch frameraten bei Audiospuren. Wie auch immer sich das verhält!? Könnte es vielleicht damit etwas zu tun haben? Blöd nur, das beim Mikrofon-Audio die Sparte nicht dabeisteht. :|

  • Erst mal was wir alles haben zusammengefasst:


    Dein Video:
    Bildwiederholungsrate : 59,940 (60000/1001) FPS
    Samplingrate : 48,0 kHz


    Deine Webcam:
    Bildwiederholungsrate : 29,970 (30000/1001) FPS
    Samplingrate : 44,1 kHz


    Dein Mikro:
    Samplingrate : 44,1 kHz


    Als globale Länge von allen nehmen wir:
    Dauer : 2 h 12 min



    Mit den Werten kann man schon gegenrechnen. Die Frage ist welches davon als Basis dient.


    In den meisten Fällen wird die FPS des Videos genommen auf die dann alles abgeglichen wird.


    2h 12m = 7920s


    7920s * 59,940 FPS = 474724,8 Frames <- Gesamt Frames des Videos
    7920s * 29,970 FPS = 237362,4 Frames <- Gesamt Frames der Webcam



    Jetzt gleichen wir mal die Webcam auf das Video ab. Also 29,970 auf 59,940 FPS
    237362,4 Frames / 59,940 = 3960s


    Differenz -> Halbe Webcamlänge


    Wenn das Video auf die Webcam abgeglichen wird, dann wären das:
    474724,8 Frames / 29,970 FPS = 15840s


    Differenz -> Doppelte Videolänge




    Das ganze kann man mit Audio machen:
    7920s * 48000Hz = 380160000 Samples
    7920s * 44100Hz = 349272000 Samples



    Webcam -> Video | 44,1kHz -> 48kHz
    349272000 Samples / 48000Hz = 7276,5s


    Differenz -> 643,5s


    Video -> Webcam | 48kHz -> 44,1kHz
    380160000 Samples / 44100Hz = 8620,41s


    Differenz -> 700,41s



    Alle Werte und Ergebnisse gehen davon aus das sich die Länge von 2h 12min aus geht.
    Die errechneten Werte sind am Anfang noch Synchron, verziehen sich aber von Sekunde zu Sekunde bis die jeweilige Differenz erreicht ist.



    Weitere Abweichungen können entstehen durch die jeweilige Software die verwendet wird beim Aufnehmen. Jede Software läuft mit einem gewissen Takt hinsichtlich Video und Audio. Das sind dann meist Werte die in Millisekunden Bereich fallen. Die sich dann aber Aufaddieren zu mehreren Sekunden.


    Müssteste überprüfen was nun mehr dran kommt von den Werten.

  • Hallo Sagaras.


    Danke für deine ausführliche Antwort. Bei all den Fakten ist mir das Wort Basis extrem ins Auge gestochen.


    Ich benutze als Basis das Gameplay-Video in Premiere. Darauf baue ich die Sequenz auf. Da dieses Video nun 48kHz und der Rest nur 44,1 wäre das ja eine Erklärung. Allerdings spinnt mir mein Kopf dann zusammen, dass beides (facecam und Mikro-Audio) ja dann gleichermaßen asynchron sein zu Basis und somit ja wieder gleich laufen müsste. Müsste ja dann eine asynchronität zwischen Video und Webcam+Mikro haben. Was mich am meisten beschäftigt ist wirklich die asynchronität zwischen Mikro (audacity) und Webcam (obs).


    Ich probiere heute Mittag das mal auf Basis der Webcam aus.


    Gruß, Hohmer.

  • Hi Demon.


    Hatte ich auch schon mal überlegt aber nie in Betracht gezogen, da ich, wie ich angefangen habe, mich für das Thema zu interessieren, gelesen habe, dass man alles idealerweise in einem unbehandelten Format aufnimmt für eine bessere Weiterverarbeitung. Ich bin davon ausgegangen das man da dann am besten fährt mit ts. MP4 dürfte ja komprimiert sein, oder!?


    Gruß, Hohmer.

  • Der Gedanke kam mir dann auch, als ich die Antwort abgeschickt hatte. Die Bitrate bleibt ja bei 40mbit weiterhin. ^^


    Edit:
    So. Ich habe jetzt als Basis mal das Facecam-Material genommen und die Sequenz darauf erstellt. Macht es leider nicht besser.
    Hab einen Versatz am Schluss von ca. 10-11 Frames. Das faszinierende daran finde ich ist, wenn man die Audiospur des Cam-Materials betrachtet und dann zwischen Bild und Audio vergleicht, ist der Peak des Klatschers nicht dort wo er sein sollte. Dort wo laut Videovorschau die Hände aufeinandertreffen ist die Audiospur leer. Der Peak des Klatschers ist vorher aber trotzdem läuft die Datei in sich synchron.


    Im Bild habt ihr Audio 1 der Webcam und Audio 2 vom Mikrofon. Das verwirrt mich eigentlich nur noch mehr. 8o


    Gruß, Hohmer.

  • So. Hab jetzt mal wieder bissl herumprobiert. Hab die Cam bzw. OBS mal auf MP4 umgestellt und mal ne knappe Stunde einfach zum Test laufen lassen. Leider ein recht ähnliches Verhalten wie auf dem Bild das ich gepostet habe. Direkt zum Beginn mal einen Peak gemacht und zwichendrin auch immer mal wieder und dann nach einer Stunde zum Schluß nochmal einen Klatscher-Peak reingehauen.


    Ich hab die beiden Tonspuren über die Sync-Funktion von Premiere mal synchronisieren lassen. Anfangs eine perfekte Übereinstimmung. Zumindest was ich vom Auge und Gehör her sehe und höre. Aber die Grafik von Premiere zeigt was anderes. der Klatscher kommt auf beiden Tonspuren dann 6 frames früher. Am Schluß nach einer Stunde hab ich bei der Tonspur von der Cam einen Versatz von ca. 11 frames (Peak früher als das Bild) und das Mikro ist 15 frames früher als das Bild.


    Das stellt mich vor ein Rätsel, denn so muss ja schon Mist bei der Aufnahme von OBS passieren oder sehe ich das falsch!? Hier sollte doch Bild und Ton eigentlich synchron aufgenommen sein!?


    Mal zu den Daten. Die Sequenz in Premiere hab ich folgendermaßen eingestellt.
    AVCHD 1080p Quadratpixel
    59,94 Frames/Sekunde


    Quadratische Pixel 1,0
    Anzeige 59,94-fps-Drop-Frame-Timecode


    Sampelrate 44100Hz
    Format: Audio-Samples


    1920x1080


    Die Dateien sehen wie folgt aus:
    Cam:
    Format : MPEG-4
    Format-Profil : Base Media
    Codec-ID : isom (isom/iso2/avc1/mp41)
    Dateigröße : 8,71 GiB
    Dauer : 1 h 1 min
    Modus der Gesamtbitrate : variabel
    Gesamte Bitrate : 20,2 Mb/s
    Kodierendes Programm : Lavf57.84.100


    Video
    ID : 1
    Format : AVC
    Format/Info : Advanced Video Codec
    Format-Profil : [email protected]
    Format-Einstellungen : CABAC / 4 Ref Frames
    Format-Einstellungen für CABAC : Ja
    Format-Einstellungen für RefFrames : 4 frames
    Format_Settings_GOP : M=1, N=30
    Codec-ID : avc1
    Codec-ID/Info : Advanced Video Coding
    Dauer : 1 h 1 min
    Bitrate : 20,0 Mb/s
    Breite : 1 920 Pixel
    Höhe : 1 080 Pixel
    Bildseitenverhältnis : 16:9
    Modus der Bildwiederholungsrate : konstant
    Bildwiederholungsrate : 29,970 (30000/1001) FPS
    Standard : Component
    ColorSpace : YUV
    ChromaSubsampling/String : 4:2:0
    BitDepth/String : 8 bits
    Scantyp : progressiv
    Bits/(Pixel*Frame) : 0.322
    Stream-Größe : 8,64 GiB (99%)
    colour_range : Limited
    Codec configuration box : avcC


    Audio
    ID : 2
    Format : AAC LC
    Format/Info : Advanced Audio Codec Low Complexity
    Codec-ID : mp4a-40-2
    Dauer : 1 h 1 min
    Bitraten-Modus : variabel
    Bitrate : 158 kb/s
    maximale Bitrate : 320 kb/s
    Kanäle : 2 Kanäle
    Channel layout : L R
    Samplingrate : 44,1 kHz
    Bildwiederholungsrate : 43,066 FPS (1024 SPF)
    Stream-Größe : 70,1 MiB (1%)
    Titel : simple_aac
    Default : Ja
    AlternateGroup/String : 1


    Mikro:
    Format : Wave
    Dateigröße : 624 MiB
    Dauer : 1 h 1 min
    Modus der Gesamtbitrate : konstant
    Gesamte Bitrate : 1 411 kb/s


    Audio
    Format : PCM
    Format-Einstellungen : Little / Signed
    Codec-ID : 1
    Dauer : 1 h 1 min
    Bitraten-Modus : konstant
    Bitrate : 1 411,2 kb/s
    Kanäle : 2 Kanäle
    Samplingrate : 44,1 kHz
    BitDepth/String : 16 bits
    Stream-Größe : 624 MiB (100%)


    Was könnte das sein!? Könnte es vielleicht daran liegen, dass bei der Cam die Bitrate des Videos konstant ist, Audio aber variabel!?


    Gruß, Hohmer.

  • So. Nach kurzer Abwesenheit melde ich mich nochmal zu Wort. Habe bis dato leider noch keine Lösung oder eine Ursache gefunden. Vor dem großen 2 Stunden-Video um das se hier geht, hab ich auch noch ein Video aufgenommen von ca. einer halben Std. Dabei hab ich nichts an den Einstellungen geändert außer eben ein weiteres mal bei jedem Programm auf "Aufnahme" zu drücken. Das Video ist richtig gut vom Material. Einmal Ton zum Video angepasst, ist das Ergebnis absolut akzeptabel von Anfang bis Ende. Sollte ein Versatz drin sein, dann höchstens 1-2 Frames, die wirklich nur mit der Lupe auffallen.


    Das große Video hab ich jetzt fertig und vor ca. einer Woche hochgeladen. Hab versucht den Versatz so gut wie möglich zu kaschieren, indem ich immer mal wieder ein paar Frames korrigiert habe nach einem Schnitt. Aber manchmal sieht man doch noch einen Versatz darin: Könnt euch das Ergebnis ja mal anschauen: VIDEO


    Ich müsste erstmal die Ursache finden warum Bild und Ton von der Webcam-Spur nicht synchron laufen oder haben andere Besitzer der C920 ein ähnliches Problem? Habe auch schon überlegt ob es an OBS liegt? Möchte aber ungern ein anderes Programm nutzen. Jemand noch irgendwelche Erfahrungen oder Ideen?


    Gruß, Hohmer.

Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!