В программе для монтажа видео используете функцию встроенную или плагин PluralEyes. Кидаете в столбик видео дорожки со звуком - и плагин выравнивает видео дорожки по звуковым, но в звуковой дорожке должен быть четкий звук по которому программа могла бы их сопоставить. Короче гуглить надо по запросу "синхронизация видео по звуку".
обычно для таких видео звук пишется не на микрофон камеры,а на отдельный носитель-и микс собирается уже в звуковых редакторах-
adobe audition-е каком нибудь,или sound forg-е,а то и в sonar-е.