До выполнения поставленной задачи, если я правильно понял вопрос.
Нейросеть (пока что) это не интеллект, даже если их так называют - они не могут обучаться чему-то "с потолка". То есть, например, нейросеть, которая учится ходить, должна получить установку, что "ходить это хорошо; чем дальше ты пройдёшь, тем лучше" - и будет стремиться к ней. Максимальным результатом её развития станет вариант, когда робот с этой нейросетью будет быстро и далеко бегать. Но, например, водить автомобиль он не сможет, пока ему не объяснят, что в этом процессе хорошо, а что плохо.
Для того, чтобы нейросеть научилась играть в "Марио" ей нужно задать кучу стартовых параметров - что бежать вправо это хорошо, что умирать это плохо, как минимум. Именно эти установки и задают развитие и его границы.