Тема 2.1. Архівація файлів. Історія комп'ютерної вірусології
Стиснення даних — процедура перекодування даних, вироблювана з метою зменшення їх об'єму. Застосовується для більш раціонального використовування пристроїв зберігання і передачі даних.
Стиснення буває без втрат (коли можливе відновлення початкових даних без спотворень) або з втратами (відновлення можливе з незначними спотвореннями). Стиснення без втрат використовується при обробці комп'ютерних програм і даних, саме його часто називають архівацією даних. Стиснення з втратами звичайно застосовується для скорочення об'єму звукової, фото- і відеоінформації, воно значно ефективніше за стиснення без втрат.
Стиснення засновано на усуненні надмірності інформації, що міститься в початкових даних. Ступінь надмірності залежить від типу даних. Наприклад, у відеоданих ступінь надмірності звичайно у декілька разів більше, ніж у графічних даних, а ступінь надмірності графічних даних у декілька разів більше, ніж текстових. Крім того, ступінь надмірності даних залежить від прийнятої системи кодування.
Прикладом надмірності є повторення в тексті фрагментів (наприклад, слів природної або машинної мови). Подібна надмірність звичайно усувається заміною послідовності, що повторюється, більш коротким значенням (кодом). Інший вид надмірності зв'язаний з тим, що деякі значення в даних, що стискаються, зустрічаються частіше за інші, при цьому, можливо, замінювати дані, що часто зустрічаються, більш короткими кодами, а рідкісні – більш довгими (стиснення вірогідності). Стиснення даних, що не володіють властивістю надмірності (наприклад, випадковий сигнал або шум), неможливе.
|
|
Питання стиснення даних достатньо гостро стоять в різних областях науки і техніки, скрізь, де потрібне зберігання і передача інформації. По-перше, це зв'язано вартістю носіїв інформації, по-друге, з необхідністю передачі великих потоків інформації по лініях зв'язку. Крім того, стиснення даних нерозривний пов'язано з криптографією і захистом інформації від випадкової і навмисної дії.
Програми, що здійснюють архівацію даних, називають архіваторами. В архіваторах розробники прагнуть поліпшити два основні параметри - ступінь стиснення і швидкість роботи. Швидкість роботи розпадається на два конкуруючі параметри – швидкість архівації і швидкість розархівування. Іноді важливим виявляється також об'єм пам'яті, що використовується. Решта властивостей менш значна і звичайно не розглядається.
Для цих параметрів звичайно рідко вдається поліпшити що-небудь одне, не погіршивши при цьому іншого. До того ж алгоритм стиснення оптимальний для одних типів даних, може бути не придатним для інших. Наприклад, архіватор створений для усунення надмірності текстів природної мови і побудований на принципах дозволяючих досягти великого ступеня стиснення саме текстів може абсолютно не стискати графічні дані або навіть збільшувати їх об'єм.
|
|
Насправді дослідниками були науково доведені теореми які накладають на архіватори і на саме стиснення даних обмеження по ступеню стиснення.
1. Для будь-якої послідовності даних існує теоретична межа стиснення, який не може бути перевищений без втрати частини інформації.
2. Для будь-якого алгоритму стиснення можна вказати таку послідовність даних, для якої даний алгоритм взагалі не дозволить отримати стиснення.
Наростання інтересу до архіваторів почалося з появою IBM-сумісних персональних комп'ютерів. До цього теж існували програми стиснення, але вони були відомі тільки фахівцям і забезпечували незрівнянно гірші показники стиснення інформації.
Сучасні програмні засоби для створення і обслуговування архівів відрізняються великим об'ємом функціональних можливостей, багато хто з яких виходить далеко за рамки простого стиснення даних і ефективно доповнює стандартні засоби операційної системи. В цьому значенні сучасні засоби архівації даних називають диспетчерами архівів.
До базових функцій, які виконують більшість сучасних диспетчерів архівів, відносяться:
– витягання файлів з архівів
– створення нових архівів
– додавання файлів в архів, що є
– створення архівів, що саморозпаковуються
– створення розподілених архівів на носіях малої місткості
– тестування цілісності структури архівів
– повне або часткове відновлення пошкоджених архівів захист архівів від перегляду і несанкціонованої модифікації.
– створення безперервних (solid) архівів
Дата добавления: 2019-02-13; просмотров: 245; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!