Видео не может прогружатся покадрово в том смысле, в котором ты имеешь ввиду. Несжатое видео где сохраняется каждый кадр отдельно 720р занимает несколько гигабайт на винчестере всего для пары минут видеопотока. Все видео которое ты видишь в интернете и у себя на компьютере -- это сжатое видео. Существует много очень сложних алгоритмов сжатия и основная идея их сделать ключевой кадр(тот, который и сохраняется полностью) а последующая серия кадров будут запоминатся лишь изменения в кадре относительно ключевого или же относительно предыдущего.
Если видео состоит из одной несменяемой картинки и музыки -- фактически прогрузится некоторое количество ключевых кадров(например 1 раз на секунду или сколько там выставлено внутри конвертера ютуба) и весь остальной трафик будет расходоватся исключительно на музыку. Если же видео конвертируется в несколько заходов -- скорее всего там будет лишь 1 кадр ключевой. И его изменения. Фактически только 1 кадр и все.