Главная причина - Java не часто используется в Data Science, потому что она не часто используется в Data Science :-) А если серьезно ну просто на ней немного подходящих для этих задач библиотек. Не наработаны паттерны для этих задач. В программировании такое сплошь и рядом. Писать системы в какой-то любой области на языке который в этой области до этого не применялся массово - это всегда изобретать велосипед.
Есть причина и в архитектуре самого языка. Жесткая, строго объектно-ориентированная, достаточно низкоуровневая (несмотря на то что шитый компилятор) Java хороша для высоконадежных приложений. Где важен результат каждой транзакции. Такие приложения обычно пишутся из расчета на долгую буквально десятилетиями жизнь. А для исследований где очень много одноразового кода написанного для однократного получения результата, много прототипов и т.п. программирование на Java - ничем не обоснованная для задач такого сорта лишняя трудоемкость