Принципы работы программы
Разделение системы наблюдений на заданное число классов (К-задача)
Принцип работы программы состоит в нахождении наилолее удаленных друг от друга (экстремальных) наблюдений и классификаци относительно них всех остальных наблюдений.
С использованием метрики находятся первые два наиболее раличающиеся наблюдения ("базовые"), а все остальные разделяются по степени близости к ним (в смысле тех же метрик) на два класса. Далее определяетися наиболее "вытянутый" из этих классов, и в нем находят наблюдение, максимально отстоящее от соответствующего базового для данного класса, и все наблюдения классифицируются уже на три класса и т.д.
Такой процесс продолжается до тех пор, пока не будет достигнуто заданное число классов (К)
В программе реализуется четыре варианта метрики. Выбирая метрику в диалоговом режиме, можно получить соответствующие им результаты.
Входные данные:
- Число объектов (строк);
- Число признаков (столбцов);
- Число классов, на которое надо разбить выборку.
- Значения.
В текстовом файле с расширением "txt" данные перечисляются через запятую .
- В первой строке:
- Тип данных - № шкалы:
- 1 - номинальная;
- 2 - бинарная;
- 3 - порядковая;
- 4 - арифметическая;
- Во второй строке через запятую:
- Число объектов (строк);
- Число признаков (столбцов);
- Число классов;
- в 2-ой строке: через запятую значения наблюдений по 1-ому объекту;
- в 3-ей строке: через запятую значения наблюдений по 2-ому объекту;
- и т.д по всем объектам.
Пример записи данных в файле данных:
6,4
0,0,0,1
0,0,1,0
0,0,1,1
1,1,0,0
1,0,0,0
0,1,0,0
Результат в табличной форме:
- Таблица 1 (для меры 1):
- Номер признака;
- Его среднее арифметическое;
- Дисперсия.
- Таблица 2.
- Номер наблюдения в выборке;
- Целая часть*100 расстояния этого наблюдения до ближайшего к нему базового наблюдения;
- Номер класса, к которому отнесено наблюдение.
- Таблица 3.
- Номера базовых наблюдений, относительно которых классифицируются все остальные;
- номера наблюдений, полярных к базовым в классе;
- квадраты расстояний между базовыми и полярными к ним наблюдениями, т.е. наибольший диаметр полученных классов.