Журнал «Continuum. Математика. Информатика. Образование»
Выпуск №2 (10) (2018)
ЭЛЕКТРОННОЕ ОБУЧЕНИЕ ВЧЕРА, СЕГОДНЯ, ЗАВТРА. ПРОБЛЕМЫ И ПЕРСПЕКТИВЫ
Рассмотрена проблема проектирования практических приложений, связанных с построением систем электронного документооборота (СЭД) на основе методов интеллектуального анализа данных и аппарата мягких вычислений, а также формирования нелинейных принципов нечетких выводов, в результате чего создается эффективный инструментарий для решения прикладных задач различных проблемных областей. Сложный характер динамических процессов, происходящих на этапах передачи и обработки электронных документов (ЭД), неоднозначность, неполнота исходной информации выделены в качестве аргументов разработки методов и алгоритмов оптимизации повышения достоверности информации на основе новых современных технологий. Сформулирована задача повышения достоверности данных в системах электронного документооборота на основе использования свойств и характеристик обучающих наборов-эталонов. Предложены принципы построения методов повышения достоверности электронных документов (ЭД) на базисе информационной избыточности различной природы. Разработаны модели эталонной проверки достоверности информации ЭД на основе формирования и использования наборов обучающих данных, в которых отражаются закономерности, свойства, особенности сильных вариаций, случайных всплесков, нестационарности информации, что позволяет обнаруживать и корректировать различного рода искажения, возникающие на этапах ввода, передачи и обработки данных. Выработаны правила контроля достоверности обработки данных для поддержания и регулирования значения выходного (расчетного) параметра управления на требуемом уровне для минимизации среднеквадратического отклонения значений контролируемого элемента ЭД от порогового, который заложен в наборе-эталоне обучения. Разработан алгоритм, реализующий процедуры разбиения общего интервала значений элементов ЭД на непересекающиеся подмножества, выделения и формирования эффективного набора-эталона. Предложена методика оценки эффективности стратегий контроля достоверности информации ЭД.
Ключевые слова
электронный документ; достоверность информации; обучающий набор; свойства; характеристики; набор-эталон; адаптивное правило; разрешенное и запрещенное подмножество; стратегия контроля; оценка эффективности; electronic document; information authenticity; traini
METHODS OF USING THE PROPERTIES AND CHARACTERISTICS OF TRAINING ETHALONS SETS FOR ENSURING THE RELIABILITY OF ELECTRONIC DOCUMENTS
The problem of designing practical applications are considered with relation in the construction of electronic document management (EDM) systems based on methods of data mining and soft computing, as well as the formation of nonlinear principles of fuzzy inferences, which results allow to create the effective tool for solving applied problems of various problem areas. Complex nature of the dynamic processes occurring at the stages of transmission and processing of electronic documents (ED), ambiguity, incompleteness of the initial information are identified as arguments for developing the methods and algorithms for optimizing the reliability of information based on new modern technologies. The problem of increasing the reliability of data in electronic document management systems is formulated on the basis of using the properties and characteristics of learning sets of standards. The principles are proposed for constructing the methods of increasing the reliability of electronic documents (ED) on the basis of information redundancy of various nature. The models of the standard verification of ED information reliability are developed on the basis of formation and use of training data sets in which regularities, properties, features of strong variations, random bursts, nonstationary information are reflected, and it allows to detect and correct various distortions arising at the stages of input, transmission and processing data. Rules for controlling the reliability of data processing to maintain and control the value of the output (calculated) control parameter at the required level are developed to minimize the standard deviation of the values of monitored ED element from the threshold value, which is laid down in the training standard set. The developed algorithm implements the procedures for partitioning a common interval of values for ED elements into disjoint subsets, separating and forming an effective reference set. The methodology for evaluating the effectiveness of control strategies for the reliability of ED information is proposed.
Список литературы
-
1. Воронцов К.В. (2004) Обзор современных методов по проблеме качества обучения алгоритмов // Таврический вестник информатики и математики. №1. С. 5-25.
-
2. Жуманов И.И., Ахатов А.Р. (2011) Интеллектуальный контроль достоверности текстовой информации на основе учета свойств и распределений данных // «Химическая технология. Контроль и управление» ТГТУ. Ташкент. № 1 (37). С.41-47.
-
3. Загоруйко Н.Г., Кутненко О.А., Зырянов А.О. (2014) Обучение распознаванию образов без переобучения // Машинное обучение и анализ данных, том 1. №7 С.891-901.
-
4. Jumanov I.I., Akhatov A.R. (2010) The control of information transfer reliability in intellectual control systems on the basis of statistical redundancy // Sixth World Conference on Intellectual Systems for Industrial Automation, Uzbekistan, TSTU. Tashkent. p. 70-75
-
1. Vorontcov K.V. (2004) Obzor sovremenny`kh metodov po probleme kachestva obucheniia algoritmov [Review of current methods on the quality of learning algorithms] Taurian Bulletin of Informatics and mathematics. №1, pp. 5-25.
-
2. Zhumanov I.I., Ahatov A.R. (2011) Intellektual`ny`i` kontrol` dostovernosti tekstovoi` informatcii na osnove ucheta svoi`stv i raspredelenii` danny`kh [Intelligent control of reliability of text information based on properties and data distributions] Taurian Bulletin of Informatics and mathematics. №1, pp. 41-47.
-
3. Zagorui`ko N.G., Kutnenko O.A., Zy`rianov A.O. (2014) Obuchenie raspoznavaniiu obrazov bez pereobucheniia [Learning to recognize images without retraining] Machine learning and data analysis. №7. T. 1, pp. 891-901.
-
4. Jumanov I.I., Akhatov A.R. (2010) The control of information transfer reliability in intellectual control systems on the basis of statistical redundancy // Sixth World Conference on Intellectual Systems for Industrial Automation, Uzbekistan, TSTU. Tashkent. p. 70-75.