Я бы посоветовал заглядывать на сайт R-bloggers.com Так можно составить представление о том, чем люди вообще занимаются - и не только в какой-нибудь компании, но и в академической среде, в здравоохранении, в госуправлении и т.п. Многие авторы анонсируют там свои книжки при помощи коротких заметок. Часто предлагается решение какой-нибудь задачи, и сразу публикуется код на R. Разумеется, ограничением является использование именно R, а не, скажем, python. Но R фантастически популярен, за последние годы издано более 400 книжек, посвящённых его применению в разных областях науки и практики. Причём практически всегда к задаче прилагаются и наборы данных, и готовый код, т.е. понять, о чём идёт речь, можно довольно быстро.
# get titanic & test csv files as a DataFrame
titanic_df = pd.read_csv("../input/train.csv")
test_df = pd.read_csv("../input/test.csv")
# preview the data
titanic_df.head()
titanic_df.info()
# drop unnecessary columns, these columns won't be useful in analysis and prediction
titanic_df = titanic_df.drop(['PassengerId','Name','Ticket'], axis=1)
test_df = test_df.drop(['Name','Ticket'], axis=1)