Алгоритми роботи документально-інформаційнї системи



Автоматичні інформаційні системи виконують всі операції з переробки інформації без участі людини.

Автоматизовані інформаційні системи передбачають участь в процесі обробки інформації і людини, і технічних засобів, причому головна роль відводиться комп'ютера. У сучасному тлумаченні в термін «інформаційна система» обов'язково вкладається поняття автоматизируемой системи. Автоматизовані інформаційні системи, враховуючи їх широке використання в організації процесів управління, мають різні модифікації і можуть бути класифіковані, наприклад, за характером використання інформації і за сферою застосування.

Автоматичні системи інформаційного пошуку використовують для зменшення так званого «інформаційного перевантаження». Багато університетів та публічних бібліотек використовують системи ІП для полегшення доступу до книжок, журналів та інших документів. Найвідомішим прикладом систем ІП можна назвати пошукові системи в Інтернеті.

Алгоритми прийняття рішень використовуються для визначення імовірності того, що документ буде відповідним до пошукового запиту. Алгоритми прийняття рішень застосовуються як доповнення до імовірнісного пошуку, для отримання додаткових доказів того, що документ може відповідати пошуковому запиту. Метод основано на виокристанні відомих залежностей для побудови невідомих. Це дозволяє кардинально знизити обсяг обчислень, які необхідні для визначення імовірності тої чи іншої події.

Мовні моделі використовуються для передбачення появи того чи іншого слова у тексті. В інформаційному пошуку використовуються статистичні мовні моделі для передбачення чи з’явиться потрібне слово (пошуковий термін) в документі. Для кожного документу зі збірки обчислюється імовірність появи в документі пошукових термінів. Згідно з цим документом упорядковуються у пошуковому списку. Ще один підхід пропонує побудову імовірнісної моделі пошуковго запиту. Тобто будується імовірнісна модель появи тих чи інших пошукових термінів у запиті Далі будується імовірнісна модель запиту як сукупності незалежних подій, де кожна подія – це поява того чи іншого терміну у пошуковому запиті. В цій моделі ми можемо врахувати навіть імовірності непояви певних термінів.

Коефіцієнт відповідності документу пошуковому запитові визначається на основі імовірності того, що документ є відповідним пошуковому запитові. Присутність чи відсутність пошукового терміну в документі використовується для визначення імовірності того, що документ відповідає інформаційному запитові. Визначення імовірності базується на попередніх статистичних даних, про те, наскільки імовірно, що документ який містить пошуковий термін A, відповідатиме пошуковому запитові, що містить термін A. Припускаючи, що пошукові терміни в пошуковому запиті є незалежні, можна обчислювати таку імовірність для кожного пошукового терміну з пошукового запиту. Загальна імовірність відповідності документу обчислюється як добуток ймовірностей відповідності для кожного терміну. Незалежність пошукових термінів в пошуковому запиті рідко спостерігається в дійсності, тому обчислення сумарної відповідності значно ускладнюється, що збільшує час інформаційного пошуку. Крім того, необхідно мати попередні дані про входження термінів у відповідні до запиту документи а також і у невідповідні до запиту документи.

 


Розділ 3. Реалізація документально-інформаційної системи з використанням хмарних обчислень

Реалізація СЕД та розгортання у хмарних середовищах

Хмарні технології та пов’язані з ними обчислення – новітня інформаційна концепція, для якої ще не сформульовані основні принципи формування та використання. Потребують подальшого уточнення як визначення самої технології, так і сценарії використання хмарних обчислень, проблеми та переваги їх застосування. Найбільш повним є визначення, наведене в [1], згідно з яким хмарні обчислення – це модель надання повсюдного і зручного мережевого доступу до загального пулу обчислювальних ресурсів, що конфігуруються, та можуть бути швидко надані і звільнені з мінімальними зусиллями по управлінню і необхідністю взаємодії з провайдером послуг (сервісом-провайдером). Впровадження таких технологій в Україні має точковий характер [2].

Основною перешкодою поширення хмарних обчислень є відсутність довіри до закордонних виробників хмарних сервісів і неоднозначність законодавчих норм щодо таких рішень. Застосування хмарних структур дає певні переваги, такі як скорочення капітальних вкладень в інфраструктуру, витрат на її підтримку, фахівців та ін., але пов'язано і з ризиками, особливо в державних структурах. Це стосується і перекладу в хмари керування системами електронного документообігу (СЕД). Тому актуальним є аналіз можливостей використання хмар в цій сфері та розробка основних принципів підвищення ефективності обробки документів та забезпечення їх надійного зберігання у хмарі.

Згідно з [1], хмарним обчисленням притаманні ряд характеристик, що роблять їх перспективними для організації електронного документообігу. Основною є сервіс самообслуговування по необхідності (On-demand self-service). Це передбачує, що споживач може самостійно забезпечувати себе обчислювальними можливостями, такими як серверний час і мережеві сховища, в міру необхідності запитуючи їх у провайдера в односторонньому автоматичному режимі, без необхідності взаємодії з персоналом провайдера. Іншою невід’ємною складовою хмарних обчислень є вільний мережевий доступ (Broad network access). Згідно з цим поняттям запрошувані сервіси доступні по мережі через стандартні механізми, що підтримують використання гетерогенних платформ так званих «тонких» і «товстих» клієнтів (мобільних телефонів, ноутбуків і КПК). Обчислювальні ресурси в хмарних технологіях організовані у вигляді пулу ресурсів (Resource pooling) для обслуговування різних споживачів в моделі множинної оренди (multi-tenant), з можливістю динамічного призначення і перепризначення різних фізичних і віртуальних ресурсів відповідно до потреб споживачів.

Особливу увагу при аналізі цієї властивості слід приділити принципу незалежності розміщення ресурсів (location independence), при якому замовник не знає і не контролює фізичне місце розташування (location) наданих ресурсів, але може специфікувати їх розташування на більш високому рівні абстракції (країна, штат або центр обробки даних). Прикладами таких ресурсів є системи зберігання, обчислювальні можливості, пам'ять, пропускна здатність мережі, віртуальні машини. Хмарні системи автоматично контролюють і оптимізують використання ресурсу, вимірюючи його на певному рівні абстракції (Measured Service) відповідного типу сервісу для кінцевого споживача (наприклад, обсягу зберігання, обчислювальної потужності, смуги пропускання і активних облікових записів користувачів). Використання ресурсів може піддаватися моніторингу, бути контрольованим і супроводжуватися звітністю, забезпечуючи прозорість споживання і для провайдера, і для споживача використаного сервісу. Обчислювальні можливості можуть бути надані швидко і еластично (Rapid elasticity), в ряді випадків – автоматично, для оперативного підвищення масштабованості (scale out) і швидкого звільнення для зменшення масштабів споживання (scale in).

Для споживача ці ресурси часто представляються як доступні в необмеженому обсязі, і можуть бути придбані в будь-який момент часу в будь-якій кількості. Обчислювальна еластичність дуже зручна для сервісів з непостійним навантаженням – при зміні загрузки вони можуть масштабуватися, збільшуючи або зменшуючи кількість вузлів, забезпечуючи користувачам прийнятний час обробки запитів, а власникам – зниження витрат. Для реалізації еластичності потрібно, щоб сервіс міг повністю використовувати еластичність хмари, необхідні додаткові зусилля при розробці сервісу, що дозволяють запускати нові вузли якомога швидше.

З точки зору організації СЄД для органів державної влади найбільш критичним є питання розміщення ресурсів. Вітчизняне законодавство вимагає зберігання даних у фізичному місті на території країни, що унеможливлює використання відомих хмарних сервісів, центри зберігання даних яких розподілені по всьому світу [4].

Аналіз моделей послуг/представлення сервісів (Service Models) с точки зору безпеки. Розглянемо існуючи моделі представлення хмарних сервісів:

1. Програмне забезпечення як послуга – Cloud Software as a Service (SaaS). Споживачу надаються програмні засоби – додатки провайдера, що виконуються на хмарній інфраструктурі. Додатки доступні з різних клієнтських пристроїв через інтерфейс «тонкого» клієнта, такий як броузер (на- приклад, електронна пошта з web-інтерфейсом). Перевагою такого виду хмарного сервісу є можливість роботи з додатками, що виконуються на хмарній інфраструктурі, не лише із застосуванням «тонких» клієнтів, але і спеціальних клієнтських застосувань, що завантажуються за потреби. Основний недолік – споживач не має можливостей контролювати саму хмарну структуру, на якої виконується прикладання. Але у ряді випадків він може отримати доступ к деяким настройкам конфігурації.

2. Платформа як послуга – Cloud Platform as a Service (PaaS). Споживачеві надаються засоби для розгортання (deploy) на хмарній інфраструктурі створюваних споживачем прикладань, що розробляються з використанням підтримуваних провайдером інструментів і мов програмування. Модель PaaS передбачає більший контроль за процесом обробки даних з боку користувача, але перекладає на нього частину відповідальності та потребує додаткових затрат на розробку прикладань. 3. Інфраструктура як послуга – Cloud Infrastructure as а Service (IaaS). Споживачеві надаються засоби обробки даних, зберігання, мереж і інших базових обчислювальних ресурсів, на яких можна розгортати і виконувати довільне програмне забезпечення, включаючи операційні системи і прикладання.

Споживач не управляє і не контролює саму хмарну інфраструктуру, але може контролювати операційні системи, засоби зберігання, розроблені прикладання та володіти обмеженим контролем над вибраними мережевими компонентними (наприклад, мережевий екран хоста, керованого споживачем). Вочевидь, модель IaaS має найбільший рівень безпеки за рахунок можливості контролю над ресурсами, але потребує більших затрат на реалізацію.

Аналіз моделей розгортання хмар (Deployment Models) с точки зору безпеки:

1. Приватна хмара (Private cloud) – функціонує в рамках обслуговування однієї організації. Така інфраструктура керується самою організацією або третьою стороною і може існувати як на стороні споживача (on premise) так і у зовнішнього провайдера (off premise).

2. Хмара співтовариства або загальна хмара (Community cloud). Хмарна інфраструктура використовується спільно декількома організаціями і підтримує обмежене співтовариство, що розділяють загальні принципи (наприклад, місію, вимоги до безпеки, політики, вимоги до відповідності регламентам і керівним документам). Така хмарна інфраструктура може управлятися самими організаціями або третьою стороною і може існувати як на стороні споживача (on premise) так і в зовнішнього провайдера (off premise).

3. Публічна хмара (Public cloud). Хмарна інфраструктура створена як загальнодоступна або доступна для великої групи споживачів (не зв'язаної загальними інтересами, але, наприклад, що належать до однієї області діяльності). Така інфраструктура знаходиться у володінні організації, що продає відповідні послуги та надає хмарні сервіси. Приналежність до однієї області діяльності може передбачати специфічні для цієї індустрії застосування, потребу в яких мають організації, що належать до цій галузі.

4. Гібридна хмара (Hybrid cloud). Хмарна інфраструктура є композицією двох і більше хмар (приватних, загальних або публічних), що залишаються унікальною суттю, але об'єднані разом стандартизованими або приватними технологіями, що забезпечують портіруємость даних і додатків між такими хмарами (наприклад, такими технологіями, як пакетна передача даних для балансу завантаження між хмарами).

Найбільш повно переваги хмар проявляються в умовах public cloud. Але сьогодні жоден з національних архівів країн, де розробляють хмарні стандарти, не рекомендує державним установам користуватися публічними хмарами [5]. Традиційні рекомендації для держорганів– створювати приватні хмари, щоб зберігати під повним контролем документи і саму хмару. Однак така модель значно знижує ефективність використання хмари і рівень економії коштів. Проблеми та перспективи впровадження хмарних технологій в електронному документообігу. Незважаючи на очевидні переваги, основним стримуючим фактором використання хмарних сервісів в органах державної влади є проблема забезпечення безпеки та низький рівень довіри до поставщиків хмарних послуг [6].

Не менш вагомою проблемою є поточне законодавство України, яке виключає розміщення та обробку важливих даних за її межами. Деякі провайдери (наприклад, Google, Symantec) декларують послуги розміщення своїх ресурсів в відповідній країні, але такі гарантії є скоріше виключенням для поставщиків послуг, та й перевірити це практично неможливо [7]. Крім того, стримуючим фактором є питання прозорості діяльності сервіс-провайдерів, труднощі з оцінкою фінансової ефективності використання хмарних сервісів та інтеграції різних хмарних сервісів між собою та з нехмарними сервісами, неготовність керівних органів до використання хмарних сервісів, труднощі міграції на хмарні технології та від одного хмарного провайдера до іншого і ін. [4] Ефективним шляхом вирішення проблеми безпеки зберігання інформації є шифрування даних. Провайдер, що надає доступ до даних, повинен шифрувати інформацію клієнта, а також у випадку відсутності необхідності подальшого зберігання, оперативно її видаляти. Зашифровані дані при передачі повинні бути доступні тільки після аутентифікації. Для забезпечення її більш високої надійності використовуються токени та сертифікати. Тоді дані будуть захищені навіть у випадку доступу через ненадійні вузли.


Дата добавления: 2018-04-15; просмотров: 213; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!