Давайте по-порядку:
Разрешение фотографии, как правило, равно разрешению (размеру) матрицы. Например матрица на фотоаппарате (телефоне) 5000*3000 пикселей. Соответственно фотография получится такого же размера. И она отображается у вас на экране растянутая на весь экран.
Видео в основном идет с максимальным разрешением 1920*1080 пикселей (я не говорю про последние модели где и 2К и 4К). Объектив мы поменять на смартфоне не можем, изменить фокусное расстояние тоже не в силах. Соответственно видео "снимается" с матрицы только лишь с определенного участка (из центра). Остальная часть матрицы не используется. И это видео у вас отображается на экране, также растянутое на весь экран. Вот вам и кажется что оно снимается с приближением. Как бы такой "цифровой зум". Все равно что вы возьмете из фотографии размерами 5000*3000 среднюю часть размером 1920*1080 и растяните ее до размеров первоначального фото.
Смартфон автоматически стабилизирует изображение, стараясь нивелировать тряску (например, естественную тряску рук), поэтому картинка «плавает» в «мозгах» телефона, а потом он кадрирует часть без полей.
Собственно,как и ответили уже. Телефон кадрирует и подрезает картинку при стабилизации. Грубо говоря имеем цифровой зум на экране нашего телефона.