Жаль что вопрос так коротко сформулирован, поэтому к сожалению трудно понять о какой конкретной проблеме идет речь. Рискну предположить что это оперативная память GPU. Решение по экономии это вынести часть вычислений на основной процессор. В keras есть соответствующие прагмы в описании модели. Возможно что даже не будет деградации производительность, поскольку вычисления будут происходить при этом параллельно.
Если это оперативная память основного компьютера, то скорее всего она исчерпана датасетом. В этом случае надо перейти к генерации батчей на лету. В keras есть соответствующий метод обучения модели.