Тема 2.1. Архівація файлів. Історія комп'ютерної вірусології



Стиснення даних — процедура перекодування даних, вироблювана з метою зменшення їх об'єму. Застосовується для більш раціонального використовування пристроїв зберігання і передачі даних.

Стиснення буває без втрат (коли можливе відновлення початкових даних без спотворень) або з втратами (відновлення можливе з незначними спотвореннями). Стиснення без втрат використовується при обробці комп'ютерних програм і даних, саме його часто називають архівацією даних. Стиснення з втратами звичайно застосовується для скорочення об'єму звукової, фото- і відеоінформації, воно значно ефективніше за стиснення без втрат.

Стиснення засновано на усуненні надмірності інформації, що міститься в початкових даних. Ступінь надмірності залежить від типу даних. Наприклад, у відеоданих ступінь надмірності звичайно у декілька разів більше, ніж у графічних даних, а ступінь надмірності графічних даних у декілька разів більше, ніж текстових. Крім того, ступінь надмірності даних залежить від прийнятої системи кодування.

Прикладом надмірності є повторення в тексті фрагментів (наприклад, слів природної або машинної мови). Подібна надмірність звичайно усувається заміною послідовності, що повторюється, більш коротким значенням (кодом). Інший вид надмірності зв'язаний з тим, що деякі значення в даних, що стискаються, зустрічаються частіше за інші, при цьому, можливо, замінювати дані, що часто зустрічаються, більш короткими кодами, а рідкісні – більш довгими (стиснення вірогідності). Стиснення даних, що не володіють властивістю надмірності (наприклад, випадковий сигнал або шум), неможливе.

Питання стиснення даних достатньо гостро стоять в різних областях науки і техніки, скрізь, де потрібне зберігання і передача інформації. По-перше, це зв'язано вартістю носіїв інформації, по-друге, з необхідністю передачі великих потоків інформації по лініях зв'язку. Крім того, стиснення даних нерозривний пов'язано з криптографією і захистом інформації від випадкової і навмисної дії.

Програми, що здійснюють архівацію даних, називають архіваторами. В архіваторах розробники прагнуть поліпшити два основні параметри - ступінь стиснення і швидкість роботи. Швидкість роботи розпадається на два конкуруючі параметри – швидкість архівації і швидкість розархівування. Іноді важливим виявляється також об'єм пам'яті, що використовується. Решта властивостей менш значна і звичайно не розглядається.

Для цих параметрів звичайно рідко вдається поліпшити що-небудь одне, не погіршивши при цьому іншого. До того ж алгоритм стиснення оптимальний для одних типів даних, може бути не придатним для інших. Наприклад, архіватор створений для усунення надмірності текстів природної мови і побудований на принципах дозволяючих досягти великого ступеня стиснення саме текстів може абсолютно не стискати графічні дані або навіть збільшувати їх об'єм.

Насправді дослідниками були науково доведені теореми які накладають на архіватори і на саме стиснення даних обмеження по ступеню стиснення.

1. Для будь-якої послідовності даних існує теоретична межа стиснення, який не може бути перевищений без втрати частини інформації.

2. Для будь-якого алгоритму стиснення можна вказати таку послідовність даних, для якої даний алгоритм взагалі не дозволить отримати стиснення.

Наростання інтересу до архіваторів почалося з появою IBM-сумісних персональних комп'ютерів. До цього теж існували програми стиснення, але вони були відомі тільки фахівцям і забезпечували незрівнянно гірші показники стиснення інформації.

Сучасні програмні засоби для створення і обслуговування архівів відрізняються великим об'ємом функціональних можливостей, багато хто з яких виходить далеко за рамки простого стиснення даних і ефективно доповнює стандартні засоби операційної системи. В цьому значенні сучасні засоби архівації даних називають диспетчерами архівів.

До базових функцій, які виконують більшість сучасних диспетчерів архівів, відносяться:

– витягання файлів з архівів

– створення нових архівів

– додавання файлів в архів, що є

– створення архівів, що саморозпаковуються

– створення розподілених архівів на носіях малої місткості

– тестування цілісності структури архівів

– повне або часткове відновлення пошкоджених архівів захист архівів від перегляду і несанкціонованої модифікації.

– створення безперервних (solid) архівів


Дата добавления: 2019-02-13; просмотров: 245; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!