ОТБОР ИСХОДНЫХ ДАННЫХ ДЛЯ ФОРМИРОВАНИЯ МАССИВОВ БАЗЫ ДАННЫХ НА ПРИМЕРЕ МНОГОКОМПОНЕНТНОЙ СИСТЕМЫ NACL–KCL–MCL2•H2O
Аннотация
Использование данных из различных источников при формировании БД наталкивается на естественные трудности, характеризующихся частичной противоречивостью и несопоставимостью результатов, полученных разными исследователями в разное время. В работе предложен способ поиска данных типа unusual data (данные вызывающие сомнения) при формировании баз данных из нескольких источников. В качестве критерия для поиска таких данных предложено использовать метод распознавания образов – решающее правило. При использовании двух и более решающих правил, рассматривающие различные аспекты данных, образуются пересечения, в которых присутствуют объекты, которые невозможно правильно классифицировать при помощи таких решающих правил. В качестве примера поиска данных типа unusual data показано применение этого метода при анализе данных по гетерогенному равновесию в системе NaCl–KCl–MgCl·H2O, опубликованных в 12 различных источниках за разные периоды времени. В частности, предложены три критерия отбора для семи разных составов твердой фазы, трех составов, различающихся количеством компонентов в нем – т. е. одно, двух и трех компонентов, а также для составов, в которых входят и не входят кристаллогидраты. В результате получены наборы решающих правил, которые с вероятностью 92–98% правильно классифицируют отобранные объекты. Часть неправильно классифицированных объектов характерны для всех трех критериев отбора. Эти объекты предложено отмечать в БД, как данные вызывающие сомнения. Получено решающее правило, позволяющее с вероятностью 98% прогнозировать наличие или отсутствие кристаллогидрата в твердой фазе в зависимости от состава насыщенного раствора NaCl, KCl, MCl2·H2O.
Об авторе
М. А. ЗильберглейтБеларусь
доктор химических наук, заведующий лабораторией
Список литературы
1. Россиев, А. А. Моделирование данных при помощи кривых для восстановления пробелов в таблицах / А. А. Россиев // Методы нейроинформатики : сборник научных трудов / Красноярский гос. тех. унив. ; под ред. А. Н. Горбаня. – Красноярск, 1998. – С. 6–22.
2. Зильберглейт, М. А. Восстановление пропущенных данных при изучении свойств совмещенных эластомеров и пластиков / М. А. Зильберглейт, Р. М. Долинская // Материалы. Технологии. Инструменты. – 2011. –Т. 16. – № 1. – С. 111–114.
3. Загоруйко, Н. Г. Алгоритмы обнаружения эмпирических закономерностей / Н. Г. Загоруйко, В. Н. Ёлкина. – Новосибирск : Наука, 1985. – 110 с.
4. Горелик, А. Л. Методы распознавания / А. Л. Горелик, В. А. Скрипкин. – М. : Высшая школа, 1984. – 262 с.
5. Вапник, В. Н. Теория распознавания образов / В. Н. Вапник, А. Я. Червоненкис. – М. : Наука, 1974. – 416 с.
6. Фомин, Я. А. Распознавание образов: теория и применения / Я. А. Фомин. – М. : ФАЗИС, 2012. – 429 с.
7. Фомин, Я. А. Статистическая теория распознавания образов / Я. А. Фомин, Г. Р. Тарловски. – М. : Радио и связь, 1986. – 624 с.
8. Здановский, А. Б. Справочник экспериментальных данных по растворимости многокомпонентных водно-солевых систем / А. Б. Здановский, Е. Е. Ляховская, Р. Э. Шлеймович. – М. : Государственное научно-техническое издательство химической литературы, 1954. – 1270 с.
Рецензия
Для цитирования:
Зильберглейт М.А. ОТБОР ИСХОДНЫХ ДАННЫХ ДЛЯ ФОРМИРОВАНИЯ МАССИВОВ БАЗЫ ДАННЫХ НА ПРИМЕРЕ МНОГОКОМПОНЕНТНОЙ СИСТЕМЫ NACL–KCL–MCL2•H2O. Системный анализ и прикладная информатика. 2016;(2):12-16.
For citation:
Zilbergleit M.A. SELECTION OF BASIC INFORMATION FOR FORMATION OF THE DB BY WAY OF EXAMPLE OF MULTICOMPONENT SYSTEM NACL–KCL–MGCL2•H2O. «System analysis and applied information science». 2016;(2):12-16. (In Russ.)