Организация информационной структуры территориально распределенной системы мониторинга состояния окружающей среды

Экологический мониторинг – информационная система наблюдений, оценки и прогноза изменений в состоянии окружающей среды, созданная с целью выделения антропогенной составляющей этих изменений на фоне природных процессов. В системе экологического мониторинга накапливается, систематизируется и анализируется информация о состоянии среды, причинах наблюдаемых и вероятных изменений состояния, допустимости изменений и нагрузок на среду в целом, существующих резервах биосферы.

В сложных территориально распределенных ИС для управления информационными ресурсами и организации эффективной системы обмена данными между БД необходимо систематизированное описание структур данных. Формы таких описаний (модели физического размещения информационных ресурсов) должны быть доступны пользователю и программным средствам системы.

Модель информационных ресурсов системы может быть очень велика, обладать значительной сложностью. Модели различных предметных областей частично пересекаются. Возникает потребность в разделении больших моделей на фрагменты, чтобы, с одной стороны, упростить модели, а, с другой стороны, избежать избыточности, задав схожие части модели один раз. Хотя модель расчленяется на фрагменты, взаимосвязи между ее элементами, попавшими в разные ее части, должны быть сохранены.

При проектировании информационной структуры территориально распределенной системы мониторинга состояния окружающей среды предлагается использовать метод моделирования информационных ресурсов системы [1].  Метод позволяет фрагментировать и детализировать модель, отражать в модели физическое размещение информационных ресурсов системы, а также связывать между собой несколько модулей моделей в единое целое путем задания связей между элементами.

Для поддержки метода моделирования информационных ресурсов системы разработана программа-дизайнер  (база данных, запросы, формы и отчеты) [2]. Каждый элемент модели (база данных, прикладной протокол, интегрируемый ресурс, схема прикладного протокола, схема интегрируемого ресурса, отдельная схема, сущность, атрибут сущности, тип атрибута, свойство типа атрибута, параметр свойства) представляется в базе данных записью. Для структурирования элементов модели дополнительно используются служебные элементы.

Информационная модель метода моделирования информационных ресурсов системы представлена на рис. 1.

Элемент, определяющий физическое размещение информационных ресурсов системы – база данных (уникальный идентификатор элемента; имя базы данных; уникальный идентификатор типа элемента); в модели представляются все модули, реализуемые в конкретной базе данных; в состав модели могут быть включено несколько БД.

Типы модулей, размещаемые в базе данных – прикладные протоколы и интегрируемые ресурсы. Один и тот же прикладной протокол или интегрируемый ресурс может быть использован в различных базах данных. Прикладной протокол может включать сущности, реализуемые в виде таблиц в базе данных; при необходимости прикладной протокол может быть декомпозирован. Интегрируемый ресурс может включать сущности, реализуемые в виде таблиц в БД,  но при необходимости может быть и декомпозирован; в состав интегрируемого ресурса могут быть включены в произвольной комбинации схемы интегрируемых ресурсов и отдельные схемы.

В состав прикладных схем, схем интегрируемых ресурсов включаются произвольное количество сущностей. Каждая сущность прикладных схем и схем интегрируемых ресурсов, включенных в прикладные протоколы и в интегрируемые ресурсы, реализуются в виде таблицы в БД.

В состав отдельных схем включаются произвольное количество сущностей, прикладных протоколов, прикладных схем, интегрируемых ресурсов и схем интегрируемых ресурсов. Сущности, включенные в отдельную схему, реализуются в виде таблиц в БД.

Отличием от прикладных протоколов и схем, интегрируемых ресурсов и схем является то, что все сущности включенных в отдельную схему прикладных протоколов и схем, интегрируемых ресурсов и схем не реализуются в базе данных (рис. 2). Прикладные протоколы и схемы, интегрируемые ресурсы и схемы отдельной схемы показывают только структуру данных, хранимых в отдельной схеме. Вместе с тем подобные данные модели могут использоваться программными средствами. Например, при выборе данных из БД при организации обменов с другими базами. В таком варианте модель информационных ресурсов (или ее фрагмент) используется в качестве метаданных.

Рис. 2. Правило декомпозиции отдельных схем

Программа [2] позволяет получить текстовую нотацию модели информационных ресурсов системы.

При наличии программ контроля состояния окружающей среды от различных разработчиков и, возможно, на разных платформах, необходима организация  представления  информации в БД ИС. Предлагается создание для этих целей программного средства, использующего в качестве входной информации данные в формате XML, который предназначен для хранения структурированных данных и обмена информацией между программами. Парсеры XML доступны практически во всех языках программирования.

Программное средство должно функционировать на БД информационной системы, являющейся интегратором данных с различных программ контроля состояния окружающей среды, проводящей полный комплекс обработки этих данных и предоставляющей результаты  агрегации пользователю.

Для программного средства-приемника определен ряд объектов данных, которые могут быть приняты. Список объектов должен быть определен по результатам анализа сущностей информационной системы, интегрирующей данные, и условий целесообразности приема данных об объектах БД интегрируемых информационных систем. Каждый объект данных характеризуется набором атрибутов: Наименование, Процедура создания объекта. Объект 2-го порядка [1] имеет набор атрибутов [X1,X2, … Xn]. При этом существуют обязательные для заполнения атрибуты Х1 – Сущность-приемник, Х2 – Атрибут-приемник, Х3 – Тип атрибута приемника, Х4 – Имя тэга XML. Атрибуты X1 и X2 позволяют идентифицировать, в какую сущность БД информационной системы-приемника, и какой из ее атрибутов должны быть помещены данные из файла, расположенные в тэге с именем X4. Атрибут X3 может иметь одно из набора значений  [строка, число, дата] и описывает тип данных, размещаемых в атрибут вышеуказанной сущности.     Кроме этого предлагаются атрибуты: флаги Уникальности, Обязательности и Первичного ключа, а также атрибут Описание и  ряд функций бизнес-логики. Атрибут Флаг уникальности позволяет задать контроль уникальности значения уже на этапе разбора документа XML формата. Флаг обязательности  используется для контроля заполнения соответствующего атрибута.

Бизнес-логика средства включает для каждого объекта  процедуру его создания. Встроенные проверки не позволят дублировать информацию, или утвердить недоопределенные или имеющие конфликтное описание объекты. Для каждого объекта Ак возможно указание функции кодирования/декодирования интуитивно понятного значения во внутреннее значение программного средства – приемника информации, функции заполнения атрибута.  Для каждого из атрибутов с произвольным значением функции декодирования должны уметь находить соответствующее значение из БД информационной системы, где расположено программное средство интеграции результатов проверки знаний. Протоколируется история разбора документа, в том числе, в случае невозможности декодирования значения, сохраняется исходное значение, не прошедшее кодировку и текст ошибки. Предлагаемая программа обеспечит доступ из интерфейса к этой информации и оповестит во всплывающем окне о наличии проблем с созданием объектов из разобранных файлов. Для не прошедших декодирование данных существовует возможность ручного ввода нужного значения и запуска дальнейшей обработки разобранного объекта.

Входные для программы-приемника XML-файлы каждому экземпляру сущности БД информационной системы-приемника сопоставляют элемент  <OBEJCT_NAME>, содержащий имя этой сущности, и вложенные элементы c именами, соответствующими значениям атрибута Х4 для каждого из объектов второго уровня Ак. Внутри каждого из вложенных тэгов должно быть прописано значение экземпляра объекта Ак. В случае необходимости внесения данных о сущностях, связанных между собой отношением 1:m любого уровня, например группа-сотрудник, используется тэг <ATTITUDE> cо вложенными тэгами <OBEJCT_NAME_GROUP>, <OBEJCT_NAME_EMPL>, <OBEJCT_GROUP_UID> и <OBEJCT_EMPL_UID>. Содержимое этих тэгов позволяет полноценно описать связи между сущностями.

Программное средство периодически просматривает рабочие каталоги ЭВМ, указанные в нем как целевые, на предмет нахождения в них неразобранных файлов. Найдя файл необходимого формата, сформированный из данных программы-источника,  программное средство-приемник  осуществляет его разбор и дальнейшее создание соответствующих экземпляров сущностей БД информационной системы программы-приемника с  заполнением атрибутов, используя функцию создания, описанную для данного  объекта, а так же выполнение всех необходимых преобразований и дополнительных действий с использованием функций бизнес-логики.

С помощью программы автоматизируется процесс сбора и преобразования данных из БД с различными внутренними представлениями данных.

Библиографические ссылки

1. Бистерфельд О.А. Принципы и программа информационного моделирования ресурсов территориально распределенных информационных систем. // Новые технологии, №3. – Москва, 2006. – С. 38-40.

2. Программа инструментальной поддержки метода моделирования информационных ресурсов информационных систем : свидетельство о регистрации программы для ЭВМ / О.А. Бистерфельд. – № 200561184 от 25.07.2005.