Мы сохранили весь контент, но добавить что-то новое уже нельзя
Как бы вы создали эту таблицу из 10 миллионов таблиц данных на первом месте?
Как бы вы выполняли кластеризацию на миллион уникальных ключевых слов, при том, что у вас есть 10 миллионов точек данных — каждая из двух ключевых слов, и метрика, оценивающая, насколько похожи два этих ключевых слова?
Кандидат филологических наук, лингвист, читатель... · 18 нояб 2021
Ваш вопрос весьма запутан. Во-первых, определитесь с терминами: 10 миллионов таблиц или точек данных (в 1 таблице)? Что такое "ключевое слово"? Что такое здесь "кластеризация"? Задача просто выделить уникальные точки данных или сгруппировать их по какому-то критерию?