В работе предложен единый подход к нескольким вариантам решения задачи о квантификации кластеров уже имеющегося кластерного разбиения конечного множества. В результате применения любого из предлагаемых подходов каждый кластер получает, вообще говоря, векторные метки. Для этого применяется методика, близкая к анализу латентных классов: каждый объект или каждый признак в рамках кластера отождествляется с некоторым вектором, а из полученных векторов геометрическим методами извлекается некая общая часть, вектор, в наибольшей степени близкий к каждому из построенных векторов. Этот вектор и объявляется меткой кластера.
В случае, когда изучаемые объекты разбиты на кластеры, для построения более точных математических моделей удобно использовать искусственную переменную, которая каждому объекту ставит в соответствие его кластер. Эта кластерная переменная нуждается в переводе в числовую форму, т.е. в квантификации. Сегодня для решения этой задачи часто применяют алгоритм анализа соответствий. Он позволяет квантифицировать сразу пару нечисловых переменных по таблицеих сопряженности. Но оказывается, метод перестает работать в случае, когда кластеры в задаче выделяются предельно четко, в частности, он склонен приписывать различным кластерам одинаковые метки. Поэтому актуальна задача его модификации. В работе обсуждаются несколько методов идентификации и последующего обхода формальных сбоев методики анализа соответствий для случая четко выделяющихся кластеров.
В работе детально описан алгоритм оптимизации кластерного разбиения. Критерием качества выбрано суммарное внутрикластерное рассеивание по всем вновь организуемым кластерам. Уменьшение этого рассеивание достигается направленным пошаговым перемещением отдельных объектов между кластерами. Алгоритм реализован в виде компьютерной программы. Приведены примеры его работы на реальных данных.
В настоящей работе рассмотрен вариант задачи анфолдинга, в которой положение части объектов (целей) уже известно, и требуется локализовать только наблюдателей - оставшуюся часть множества объектов. Предлагается процесс заполнения пропущенных позиций матрицы различий реализовать через построение промежуточной визуализации в искусственном пространстве изображений с точным соблюдением всех заданных изначально расстояний. При этом оказывается, что для того, чтобысделать построение промежуточной визуализации простым и, желательно, однозначным, достаточно подобрать подходящую размерность пространства изображений. Если возможность неоднозначного построения, тем не менее, будет не полностью исключена, то она окажется сведенной к небольшому количеству возможных вариантов.После построения каждого из допустимых вариантов промежуточной визуализации недостающие в исходных данных различия уже вычисляются, и есть возможностьзаполнить матрицу различий целиком. Выбор из набора потенциальных вариантов заполнения матрицы можно затем осуществить путем их перебора.