Інформаційна діяльність Росії щодо УкраїниNbsp;   План: 1. 2. 3.   http://bukvar.su/zhurnalistika/page,2,180737-Obraz-Rossii-v-britanskih-SMI.html http://www.niss.gov.ua/articles/1476/ http://uk.wikipedia.org/wiki/Російська_інтервенція_в_Україну_2014#.D0.86.D0.BD.D1.84.D0.BE.D1.80.D0.BC.D0.B0.D1.86.D1.96.D0.B9.D0.BD.D0.B5_.D0.B7.D0.B0.D0.B1.D0.B5.D0.B7.D0.BF.D0.B5.D1.87.D0.B5.D0.BD.D0.BD.D1.8F_.D0.B2.D1.96.D0.B9.D0.BD.D0.B8 http://uk.wikipedia.org/wiki/Фрейм_(психологія) http://www.webeffector.ru/wiki/Парсинг http://ru.wikipedia.org/wiki/Синтаксический_анализ    

МЕТА І ЗАВДАННЯ КУРСОВОГО ПРОЕКТУ

Основною метою курсового проекту є дослідження аналізу даних Web Mining . А також, застосування знань для рішення конкретної задачі, а саме аналіз інформації про політичних діячів, а саме Маргарет Тетчер . Набуття і закріплення навиків роботи з програмою парсингу Datacol.

    Для початку моїм завданням є пошук необхідної інформації . Для аналізу інформації зібраної раніше, необхідно спершу здійснити її очистку Після чого, інформація структуризується і можна робити аналіз. .

 

ВСТУП

 

    Web Mining - застосування інтелектуального аналізу даних методів виявити шаблони з веб.

Web Mining - застосування методів в алгоритмів Data Mining для пошуку залежностей і знань в мережі Інтернет.

Web Mining є причиною розвитку електронного бізнесу. За допомогою web mining можна визначити інтереси і переваги кожного з відвідувачів , можна спостерігати за його поведінкою, можна також заохочувати інших відвідувачів.

В даній курсовій роботі, я досліджую поширення інформації про смерть Маргарет Тетчер в Інтернеті , а також її дослідження (найбільша поширеність в Інтернеті, заінтересованість в країнах,поширеність серед користувачі глобальної мережі).

Web Mining застосовує технології Data Mining для аналізу неструктурованої , неоднорідної і великої за обсягом інформації, які розповсюджуються на різноманітних веб сторінках .

В даній курсовій роботі я буду використовувати аналіз веб-сторінок для пошуку інформації про смерть Маргарет Тетчер. Для цього я буду застосовувати програму Datacol (програму для парсингу).

 

АНАЛІЗ ДАНИХ WEB MINING

Основні етапи проведення Web Mining

    Web Mining – набор методів Data Mining, які дозволяють обробляти дані, які знаходяться в мережі Інтернет. Як правило, такі методи в більшості випадків використовуються в електронному бізнесі (комерції) і лежать в основі статистичної інформації.

    Основними етапами Web Mining є:

1. Вхідний етап (input stage) – отримання необроблених даних з мережі Інтернет. Такими даними є інформація на веб сторінках, яка є доступною для всіх користувачів. Збір інформації відбувається за допомогою різного програмного забезпечення , такого як Datacol (відома, як одна з найкращих програм парсингу), ZoloPages, InfoStream.

2. Етап перед обробки даних (preprocessing stage) . При цьому, перед обробка відбувається наступним чином:

-   очистка даних (набір даних потрібно відфільтрувати від інформації, яка генерується автоматично з загрузкою веб сторінки);

-   видалення записів, які показують неактивність користувача (веб-боти переглядають величезну кількість сторінок в Інтернеті, при цьому вони дивляться на активність користувачів (останній вхід на сайт, редагування даних, публікація нової статті) ;

-   визначення кожного окремого користувача – більшість сайтів не використовую систему реєстрації, тому користувачі, які відвідують такі сайти є анонімними. Це не досить зручно пошуковим системах , а також для обробки веб даних. Але більшість розкручених сайтів, або таких, які обмежують свою інформацію для стороннього перегляду все ж таки використовують систему реєстрації, при цьому користувач вносить контактну інформацію про себе. За допомогою реєстрації (кук-файлів) можна визначити інтереси користувача, які можуть значно розширити клієнтський склад великих корпорацій. В моєму випадку, можна дослідити користувачів, які публікують статті про політику Великої Британії ( а саме смерть Маргарет Тетчер), а також категорії заінтересованих користувачів.

- Ідентифікація користувача сесії – це означає, що для кожного візиту визначаються сторінки за запитом і порядок їх перегляду.

- Знаходження повного шляху, використаного користувачем.  

3. Етап моделювання (parent discovery stage) – використовується попередньо оброблені дані для створення моделі процесу, при якому буде досліджуватися дана інформація.

4. Етап аналізу моделі (parent analysis stage) – інтерпретація(роз’яснення, тлумачення) отриманих даних. [5]

Після аналізу етапів проведення Web Mining потрібно провести дослідження категорій , що дасть змогу виділити основні завдання інтелектуального аналізу даних текстової інформації.

2.1Категорії Web Mining

Web Mining – видобуток цікавих і потенційно корисних моделей і нечіткої інформації або діяльності, пов’язаної з всесвітньою павутиною. Є приблизно три області виявлення знань, які належать Web Mining: Витяг веб-контенту - Web Content Mining, Витяг веб-структур - Web Structure Mining, і Аналіз використання веб-ресурсів - Web Usage Mining.

   

    Вилучення веб-контенту – це тип видобутку інформації , який дозволяє збирати інформацію, яка необхідна для доступу до веб-сторінок. Ця інформація збирається автоматично в журнали доступу через веб-сервери. Статистика видобутку дозволяє компанії отримувати продуктивну інформацію , яка може покращити розвиток цієї компанії. Також можливе , отримання нових результатів для дослідження глобальної мережі, а саме її розвиток, розширення, зацікавленість користувачів , поширення (популяризація) сайтів або різноманітних трендів тощо. Використання даних може також бути корисним для розробки маркетингових навичок.

Вилучення веб-структур – це інструмент який використовується для визначення відносин між веб-сторінками, посилання на інформацію та або пряме підключення посиланнями. Ця структура бази даних може бути виявлена шляхом надання веб-схеми структури бази даних через методи, які використовуються для пошуку інформації веб-сторінок. Цей метод визначення відносин виконується за допомогою “павуків”, які сканують веб-сайти, основну увагу звертаючи на головну сторінку (індексну, а не категоріальні). Ці “павуки” пов’язують інформацію за допомогою посилань, для з’єднання з конкретними сторінками, які містять потрібну інформацію. [7] 

Аналіз використання веб-ресурсів – видобуток веб ресурсів за допомогою сканування веб-сторінок і видобутку тексту, зображень і графіки, веб-сторінки для визначення актуальності змісту в пошуковому запиті. Це сканування завершується після кластеризації веб-сторінок через структури інтелектуального аналізу даних і забезпечує результати, засновані на рівні відношення до запропонованого запиту. Зміст самих веб ресурсів надає списки результатів у пошукових системах в порядку найвищого відношення до ключових слів у запиті.

Видобуток змісту веб-сторінки – це є один з підкатегорій вилучення веб-контенту. Видобуток собою представляє пошук необхідної інформації для аналізу певних явищ, для отримання певних характеристик, для створення нових видів методів (методик).[8]

Результат пошуку – це отримані дані в результаті видобутку змісту веб-сторінок. Це вибрана інформація, яка підлягає її обробці. При цьому, інформація могла бути найдена не точна, а лише подібна. Тому за допомогою очистки і узагальнення можна зробити висновок, по знайденому матеріалу.

Загальне відстеження доступу до файлів – основною метою цієї під категорії є полегшення доступу користувачів до необхідних даних.[6]

Індивідуальний контроль використання – основною метою є налагодження сайту для користувача, що відображається в пошуку глибинної структури сайту і формати ресурсів можуть динамічно налаштовуватись для кожного користувача з певним періодом часу в залежності від їх моделей доступу. [2]

Провівши дослідження категорій Web Mining потрібно виділити задачі та охарактеризувати проблему оцінки впливу діяльності політичних діячів в сфері міжнародних відносин.

 Задачі Web Mining

Всі задачі, які вирішуються методами обробки та аналізу даних в Інтернеті, можна поділити на наступні групи:

- Виявлення шаблонів поведінки користувача – вирішення таких задач дозволяє найбільш поширений контент веб-ресурсів, знаходити інформацію серед великої кількості інформації (велика кількість сайтів),визначення закономірностей пошуку інформації користувачами;

- Пошук релевантної інформації – використання пошукових систем для пошуку інформації користувачами, а також використання пошукових машин в локальному середовищі для знаходження інформації на локальному комп’ютері , серед бази даних;

- Вилучення інформації (контенту) з неструктуризованих джерел – дозволяє формувати структуризовані документи з глосарієм, із структуризованим змістом на основі безлічі неструктуризованих даних;

- Аналіз структури сегментації в мережі Інтернет;

- Персоналізація інформації;

- Пошук шаблонів в поведінці користувачів. [8]

Для пошуку необхідної інформації користувачі зазвичай використовують пошукові системи. При цьому часто використовую прості запити, які складаються з ключових слів. Результати виконання запиту є список сторінок, відсортовані по деякому індексі релевантності, описуючи ступінь спів падіння з запитом. Однак, існують пошукові механізми, які мають деякі недоліки. Основними з яких є низька точність результатів. Це спричинено малим врахуванням семантичних зв’язків і контексту знайдених в тексті виразів. Індексація необхідних елементів мережі з використанням інтелектуального аналізу даних, а саме які використовують алгоритми математичну лінгвістику та обробку мовних елементів в мережі, які являються одним з найперспективніших методів Web Mining в пошуку інформації [4].

Аналіз структури сегментації в мережі Інтернет полягає в аналізі структури посилань між різними веб - сторінками, внутрішніми і зовнішніми сайтами. Поява цього виду задачі була спричинена необхідністю вирішенню питань, які виникають в результаті аналізу соціальних мереж або специфічних областей людської діяльності або знань. Результатом такого аналізу може бути знайдений набір специфічних сторінок. Такими сторінками можуть бути:

· Хаби – з такої сторінки посилання йдуть на найбільш значущі ресурси в даній галузі знань або в соціальних мережах найбільш авторитетними представниками цих соціальних мереж;

· Авторитети – сторінки, на які посилаються велика кількість авторів різноманітних тематик або користувачів соціальної мережі, до “дружби” з якими прагне велика кількість користувачів.

Вилучення інформації (контенту) з неструктуризованих джерел являє собою дослідження знайдених веб-сторінок, отриманих в результаті запиту користувача. Далі необхідно виконати обробку даних з точки зору автоматичної класифікації, створення заголовків, пошук ключових слів і загальних тем. Знаходженні дані можуть представлятися в вигляді дерев, описуючи структуру документів і в вигляді логічних і семантичних виразів. Вирішення частково цих проблем може підпадати під Text Mining –технологія автоматичного вилучення даних в великих об’ємів такстових матеріалів.

Персоналізації інформації – задача по створенню веб систем, які адаптують свої можливості піж користувача на основі зібраної і проаналізованої інформації . [4]

Пошук шаблонів в поведінці користувачів - задача подібна до попередньої , але основною її ціллю являється адаптація ресурсів під користувача, а пошук закономірностей в шаблонах взаємодії користувача з веб-ресурсом. Основною метою є прогнозування майбутніх дій. Аналізуючи дії користувачів можуть включати не тільки переходи по посиланнях, а й відправка форм, прокрутка сторінок, додавання в обрані сторінки в браузері тощо. Знайденні шаблони використовуються в майбутньому для оптимізації структури сайту, вилучення цільової аудиторії і для прямого маркетингу.

Розроблено безліч підходів до вирішення завдання з виявлення знань з шаблонів навігації користувачів (Jose Borges и Mark Levene "Data Mining of User Navigation Patterns", A. G. Buechner "Navigation Pattern Discovery from Internet Data").

З точки зору застосування алгоритмів інтелектуального аналізу даних при пошуку шаблонів поведінки користувача найчастіше використовуються такі методики :

· Кластеризація – пошук груп схожих відвідувачів, сайтів, сторінок, тощо.

· Асоціація – пошук спільно запитуваних сторінок, наприклад для замовлення необхідних товарів.

· Аналіз послідовностей - пошук послідовності дій. Найбільш часто застосовується варіант алгоритму Apriori, розроблений для аналізу частих наборів. [4]

Отже, аналіз політичних постатей засобами Web Mining дозволить виділити актуальні питання міжнародних відносин або провести аналіз подій , що пов’язані з їхньою діяльністю.

 

Парсинг

Синтакси́чний ана́ліз (па́рсинг) (англ. parsing) — в інформатиці це процес аналізу вхідної послідовності символів, з метою розбору граматичної структури згідно із заданою формальною граматикою. Синтаксичний аналізатор (англ.parser) — це програма або частина програми, яка виконує синтаксичний аналіз.

Під час синтаксичного аналізу текст оформлюється у структуру даних, зазвичай — в дерево, яке відповідає синтаксичній структурі вхідної послідовності, і добре підходить для подальшої обробки. Зазвичай синтаксичні аналізатори працюють в два етапи: на першому ідентифікуються осмисленітокени (виконується лексичний аналіз), на другому створюється дерево розбору. (1)

Три фази парсинга є логічними стадіями процесу: спочатку це пунктуальний збір інформації, наприклад, це може бути код інтернет-сторінки. Потім аналіз даних, обробка і перетворення в потрібний формат. Нарешті - надання результату, висновок даних. Найбільш часто парсинг спирається на систему регулярних виразів.(2)

Як правило, результатом синтаксичного аналізу є синтаксичну будову пропозиції, представлене або у вигляді дерева залежностей, або у вигляді дерева складових, або у вигляді деякого поєднання першого і другого способів подання.

 

Відновлення після помилок

Найпростіший спосіб реагування на некоректний вхідний ланцюжок лексем - завершити синтаксичний аналіз і вивести повідомлення про помилку. Однак часто виявляється корисним знайти за одну спробу синтаксичного аналізу якомога більше помилок. Саме так поводяться транслятори більшості поширених мов програмування.

Таким чином перед обробником помилок синтаксичного аналізатора стоять наступні завдання:

 

• він повинен ясно і точно повідомляти про наявність помилок;

• він повинен забезпечувати швидке відновлення після помилки, щоб продовжувати пошук інших помилок;

• він не повинен істотно уповільнювати обробку коректної вхідного ланцюжка. (1)

 

Інформаційна діяльність Росії щодо України

Від часу проголошення незалежності України Російська Федерація веде постійну інформаційну війну проти України. Особливо вона була інтенсифікована в роки правління проросійського режиму Януковича. Від початку агресії Російської Федерації (лютий 2014) російська пропаганда набула форм Геббельсівської пропаганди часів Другої світової війни . З метою дискредитації українських діячів використовуються провокаційні заяви нібито від їх імені на підставі яких у той же день державні органи Російської Федерації порушують кримінальну справу. Громадяни Російської Федерації та аудиторія російських телеканалів в інших країнах — Перший канал (Росія), Росія-24та інших — свідомо вводиться в оману керівництвом Російської Федерації.

Інформаційна політика Російської Федерації набула характеру цілеспрямованої інформаційної війни проти України: необ'єктивність, перекручування фактів, відверта неприхована брехня, путінсько-кремлівська пропаганда як частина політики Кремля в цілому. Робота ЗМІ ведеться за типомжовтої преси. Залучена величезна кількість акторів — громадян Росії, України та інших країн — а також інших спеціалістів на території України для отримання потрібної телевізійної картинки.

Протягом кількох місяців здійснюються DDOS-атаки на українські інформаційні сайти: Цензор. НЕТ, Тиждень.ua,Українська правда та інші,— а також на сайт МВС України, з появою на ньому оголошення у розшук В. Януковича.

Представники керівництва та дипломати Російської Федерації у своїх виступах, включаючи й виступи в ООН, розповсюджують неправдиву інформацію. Під час прес-конференції в Москві на пряме запитання журналіста, чи для блокування українських військових частин використовуються військові Російської Федерації, президент РосіїВолодимир Путін заявив, що це сили «кримської самооборони» і що РФ ніякої участі у підготовці цих сил не брала[55]. Однак, аналіз світлин бойової техніки, що блокує українські військові частини у Криму (за матеріалами російського видання The New Times), свідчить, що за номерними знаками це військові автомобілі Північно-HYPERLINK "http://uk.wikipedia.org/wiki/Північно-Кавказький_військовий_округ" Кавказького військового округу, на борту однієї з машин видно значок гвардійської дивізії, який забули закамуфлювати, а також модифікації стрілецької зброї (наприклад, самозарядна снайперської гвинтівки Драгунова), що офіційно надходить на озброєння тільки до російських військових[56],— все це вказує на використаннязбройних сил Російської Федерації для ескалації конфлікту в Криму.

Звинувачення України в антисемітизмі

Представники єврейської громади України, звернулися із відкритим листом до В. Путіна, щоби прояснити реальну ситуацію із правами росіян в Україні, де вказали, що вони «впевнені», що його «неможливо ввести в оману.» А це означає, що він «сам свідомо вибирає із маси інформації про Україну неправду й наклепи.» І йому добре відомо, що слова Януковича під час прес-конференції у Ростові-на-Дону, про те, що «… Київ був заповнений озброєними людьми, котрі почали громити будівлі, культові установи, храми.<…> Людей просто грабували й убивали на вулицях» — це брехня від першого й до останнього слова. Вони також вказали, що В. Путін «переплутав Росію й Україну», коли говорив про ріст антисемітизму в Україні. Навпаки, у Росії єврейські організації зафіксували минулого року зростання антисемітизму. В Україні ж, навіть націоналістичні групи не дозволяють собі демонструвати антисемітизм та інші форми ксенофобії. В Росії ж неонацистські організації заохочуються спецслужбами. У листі також вказано, що "стабільність в нашій країні під загрозою. І ця загроза виходить від російської влади, тобто — від Вас. Це Ваша політика підбурювання до сепаратизму і грубого тиску на Україну являє загрозу для нас — євреїв, як і для всього народу України, включно із жителями Криму та південного сходу України, і вони в цьому дуже швидко переконаються

Оцінку інформаційної війни проти України 7 березня дав Євген Марчук — екс-голова СБУ, раніше — прем'єр-міністр, міністр оборони та секретар РНБО України. Він вказав також на потрібні на сьогодні заходи державних органів, щоб протидіяти інформаційній та військовій агресії Російської Федерації[58].

Інформаційну війну, що є інформаційним забезпеченням агресії Російської Федерації проти України, відомий російський політик Борис Нємцов охарактеризував як війну нацистського режиму проти демократичної держави: «Виграти війну можуть нацисти із Геббельсом на чолі. Те, що Україна програла інформаційну війну - це факт. Але те, що ви не повинні з цього приводу дуже переживати - це теж факт. Ви ж не нацистська держава», - сказав російський опозиціонер

Інформаційні атаки агресора

6 березня на території АРК відключили телеканали «1+1» і 5-ий. Ще раніше російський телеканал «Россия 24» захопив ефірні частоти кримської приватної «Чорноморської телерадіокомпанії». Було також заблоковано державну телерадіокомпанію «Крим» у Сімферополі особами у камуфляжній формі без зброї. Генеральний директор ТРК Степан Гулеватий викликав міліцію, але вона не реагувала на виклик

6 березня 2014 р. на сайті телеканалу АТR був проведений інтернет-референдум, під час якого можна було висловити свою думку щодо приєднання Криму до РФ. Більшість людей, які прийняли участь у голосування, висловилась проти. [61] Тому вже 7 березня російські військові у Криму відключили від інтернету перший кримськотатарський телеканал АТR. Того ж дня вони зупинили ефірне аналогове мовлення українського телеканалу «Інтер», на частотах якого транслюється НТВ.[61]

ЩОДО ІНФОРМАЦІЙНО-ПСИХОЛОГІЧНОЇ СКЛАДОВОЇ АГРЕСІЇ РОСІЙСЬКОЇ ФЕДЕРАЦІЇ ПРОТИ УКРАЇНИ (за результатами подій 1-2 березня 2014 року)

 

Намагання Російської Федерації провести кампанію із введенням збройних сил до АР Крим супроводжувалось діями, які мали всі ознаки підготовленої та продуманої за цілями, заходами та наслідками інформаційно-психологічної спецоперації, скерованої в першу чергу на російську аудиторію, а з іншого боку на українську та західну аудиторію.

 

Ключовими завданнями цієї спецоперації було:

1. Деморалізація населення України.

2. Деморалізація особового складу збройних сил та силових відомств, а також спонукування їх до державної зради й переходу на бік супротивної сторони.

3. Формування у громадян Росії та України викривленого «медіа бачення» подій, що відбуваються, а не їх дійсних причин та наслідків.

4. Створення вигляду масової підтримки дій РФ з боку населення Південно-Східних регіонів.

5. Психологічна підтримка українських прихильників радикального зближення регіонів Сходу й Півдня України з РФ.

Зазначені завдання реалізувались через майже повний спектр каналів комунікацій, до яких передусім слід віднести:

1. Традиційні ЗМІ.

2. Електронні ЗМІ (телебачення).

3. Інтернет ЗМІ.

4. Соціальні мережі.

При цьому використовувалися усі методи інформаційно-психологічної боротьби – від розміщення тенденційною інформації та напівправди до неприхованої неправди («фейку»).

 

 

Фрейм

Фрейм (англ. frame — «каркас, остов», «будова, структура, система», «рамка», «окремий кадр фільму» та ін.) — структура, що репрезентує стереотипні ситуації у свідомості (пам'яті) людини або інтелектуальної системи і призначена для ідентифікації нової ситуації, що базується на такому ситуативному шаблоні.

Фрейм, за визначенням М. Мінського, є ієрархічно впорядкованою репрезентацією певної стандартної ситуації дійсності. У формальній нотації він може бути представлений у вигляді графової структури, де головна позначає об'єкт (наприклад, «кімната»), а підпорядковані вершини-елементи цього об'єкта, які можна спостерігати з певних позицій . Вважається, що у довгостроковій пам'яті людини зберігається великий набір різноманітних фреймів, що актуалізуються під час пред'явлення нових сцен. Для розпізнавання сцен в пам'яті людини має актуалізуватися саме той фрейм, що якнайбільше відповідає гіпотезі про об'єкт, який сприймається. У такий спосіб здійснюється ідентифікація об'єкта у свідомості людини. Наприклад, інтелектуальна система, що використовує фрейм «кімнати», має змоделювати здатність людини, що входить до кімнати, охопити все єдиним поглядом, скласти уявлення про те, що є у кімнаті, як розставлені меблі, скільки у кімнаті вікон тощо.

Фрейм репрезентує у свідомості людини (або у її комп'ютерній моделі) не лише стереотипну ситуацію, але водночас і зв'язки цієї структури з деякими іншими видами інформації, зокрема, з інформацією про те, як користуватися фреймом та що слід робити, коли сподівання не виправдовується. Один із провідних дослідників у галузі штучного інтелекту Р. Шенк наголошував, що «винахід фрейму» став справжньою сенсацією для штучного інтелекту; ця структура виявилася надзвичайно важливою не тільки для вирішення проблеми розпізнавання візуальних образів, але майже одразу для створення моделей розуміння природної мови.

Структура фрейму включає три основні типи даних; поняття(назва фрейму), характеристика (назва термінала—вершини нижнього рівня), значення характеристики (заповнювач термінала). У зв'язку з цим можна вважати, що у фреймі реалізовано деякі загальні принципи, що властиві організації без даних, де як одиниці виділяються об'єкти, характеристики та їхні значення, а також семантичним сіткам, у яких розрізняють абстрактний та конкретний рівень. Фрейм надає засоби організації знань у слотах , що містять характеристики та структури. В моделі фрейму—це щось на зразок схеми з категоріями і під категоріями. Фрейм—це абстрактний образ для представлення деякого стереотипу сприйняття. Наприклад, згадування слова «кімната» породжує у слухачів образ кімнати: житлове приміщення з чотирма стінами, стелею, підлогою, вікнами та дверима, площею приблизно 6—20 м².

В теорії фреймів такий образ кімнати називають фреймом кімнати, фреймом також називають і формалізовану модель для представлення образу. З такої моделі не можна нічого забрати, але є можливість заповнення певних дірок в атрибутах, таких, як кількість вікон, колір стін, висота стелі, покриття підлоги та інше. Розрізняють фрейми—взірці або прототипи, які зберігаються в базі даних, та фрейми—екземпляри, котрі створюють для відображення фактичних ситуацій на основі даних, що надійшли. Модель фрейму є достатньо універсальною, оскільки дозволяє відобразити все різноманіття знань через фрейми структури, які використовуються для позначень об'єктів та понять (позика, заклад, вексель); ролей (менеджер, касир, клієнт); сценаріїв (банкрутство, зібрання акціонерів, святкування уродин); ситуацій (тривога, аварія, робочий режим пристрою) і т. д.

Останнім часом спектр застосування концепції фреймів суттєво розширений: до нього увійшли лінгвістична семантика, когнітивна теорія метафори, прикладна семіотика, теорія репрезентації ментальних станів та дій тощо.

Особлива чутливість до концепції фреймів та успішна асиміляція цієї концепції в лінгвістиці пояснюється тим, що по суті фрейм не є для неї абсолютно новим поняттям. Прямими аналогами або лінгвістичними прообразами такої концепції можна вважати ті лінгвістичні напрями, що займаються відмінковими «рамками» дієслів. Це насамперед відома «глибинно-відмінкова граматика» (Ч. Філлмор), а також концепція ситуаційно-рольового тлумачення лексичних значень та тематичних груп (Ю. Д. Ампресян, О. К. Жолковський, Ю.С. Мартем'янов, В. Ю. Розенцвейг, Ю. К. Щеглов та інші); теорія семантичних полів Й. Трира, концепція репрезентації певних типів лексичних значень мовою думок Lingua mentalis А. Вежбицької тощо. Найзначніші теоретичні та прикладні результати дає використання фреймів для розроблення систем розуміння природної мови.

Серед теоретичних результатів варто насамперед згадати запропоновану Ч. Філлмором концепцію двох семантик, що спирається на використання фреймів.

Фреймові концепції

Аналізуючи роль фреймів у моделюванні розуміння природної мови, Ч. Філлмор розрізнює дві семантики: семантику, орієнтовану на розуміння (Р-семантику), та семантику, орієнтовану на визначення істинності висловлювань (І-семантику). При цьому Р-семантика оперує поняттям інтерпретуючого опису семантики лексем, граматичних категорій та тексту. Найбільш «концентроване» застосування фрейм знаходить у теорії розуміння Ч. Філлмора, яку він називає Р-семантикою другого рангу. Така семантика включає три компоненти: композиційну семантику (фреймову структуру тексту), практичне міркування, що ґрунтується на використанні фреймових знань (знань про реальність) та забезпечує виявлення імпліцитних семантичних зв'язків між висловлюваннями в тексті; міркування, що спирається на знання про комунікативні наміри, репрезентовані у фреймовій формі. У ситуації міркування природно-мовне виведення розглядається як сукупність операцій над елементами фреймів.

Використанню фреймів у моделях розуміння смислу зв'язаного тексту присвячені дослідження Р. Шенка та його колег. У їх концепції проголошується центральна роль каузального зв'язку в організації смислової структури тексту. Смисл, за Шенком, це концептуальна структура, а експлікатом такої концептуальної структури є каузально зв'язаний ланцюг подій. Події, в яких зливається найбільша кількість каузальних ланцюжків, утворюють понятійний стрижень—фабулу розповіді. Зв'язність тексту має визначатися через каузальну інтерпретацію концептуальних структур, з яких складається текст. Причинні зв'язки, що поєднують певну подію з іншою, мають виявляти смисл цієї події з точки зору ширшого контексту. Це останнє завдання і виконує фрейм-структура.

Р. Шенк розрізняє два типи фреймових структур: сценарії та плани, що складаються з послідовності елементарних дій. Елементарні дії об'єднані в певні класи, наприклад, клас PTRANS означає «переміщати» (про фізичні об'єкти), клас MTRANS—«переміщати» (про мисленнєві операції), клас MOVE—«рухатися» тощо. Під сценарієм Р. Шенк розуміє детермінований каузальний ланцюг концептуалізацій, що описує стандартний перебіг подій у будь-якій відомій ситуації. Окремі події зв'язані між собою за принципом причинно-наслідкового ланцюга: результатом кожної дії стає ситуація, де є можливою чергова подія. Основна функція сценарію полягає у керуванні процесом виведення наслідків. Сценарії описують стандартні, типові ситуації реальності; вони складаються з назви ситуації, ролей, тобто імен учасників ситуації, переліку причин виникнення певної ситуації та набору сцен, де кожна сцена описана як набір елементарних дій. Так, сцена «вхід до ресторану», що входить до сценарію «Відвідання ресторану», може бути описана як послідовність таких елементарних дій: PTRANS—увійти в ресторан; MTRANS—знайти вільний стілець; MOVE—сісти тощо.

Плани — це засіб, за допомогою якого встановлюється причинно-наслідкові зв'язки між сценаріями. План описує стандартну послідовність дій людини в тому чи іншому випадку; він складається із сцен та сценаріїв, що ведуть до певної мети.

Своєрідний фреймовий підхід розвивається у моделях Є. Чарняка, що оперують «системами знань», налаштованими на розуміння коротких дитячих розповідей та логічне виведення наслідків. Коментуючи історію формування фреймового підходу на матеріалі підходу Є. Чарняка, Х. Ийм та М. Салувеєр підкреслюють, що шлях до визнання фреймів у цьому випадку пролягав через відмову від так званої концепції «демонів», у певному відношенні близьку до концепції фреймів.

Під демонами у теорії розпізнавання образів розуміють певного типу факти та правила, зв'язані з деякими ключовими поняттями та темами. Коли у тексті експліцитно або імпліцитно згадується відповідна тема, зв'язані з нею демони актуалізуються. Їх функція полягає у додаванні інформації, зосередженої у знаннях, до інформації, безпосередньо представленої у тексті. Наприклад, один з демонів, що зв'язаний з поняттям «дощ», є такий: «якщо йде дощ, а Р знаходиться ззовні, то Р стає мокрим». Проте використання демонів породжує багато проблем. Зокрема, якщо у тексті згадується «ключова» тема, вона автоматично «збуджує» всіх зв'язаних з нею демонів. Крім того, виявляється, що демони не дають можливості з'ясовувати часові співвідношення подій. Для подолання таких проблем Є. Чарняк звертається до фрейм-структури. У його трактуванні фрейм складається з так званих «фреймових тверджень», що описують у досить загальних категоріях окремі дії та їх етапи. Кожне речення у розповіді, що аналізується, інтерпретується як реалізація одного або кількох фреймових тверджень. У процесі аналізу тексту конструюється його «фреймове зображення», та ведеться обмін того, які частини фрейму та до якої межі вже реалізовані у тій послідовності подій, що детермінована фреймом. Це дає змогу реконструювати «правильний» хід подій у процесі аналізу розповіді, де окремі події описуються не у жорсткому часовому порядку.

На відміну від наведених вище фреймових концепцій Ч. Філлмора, Р. Шенка, Є.Чарняка, де впевнено проголошується велика креативна спроможність фрейму як категорії репрезентації знань у моделях розуміння природної мови, у праці Й. Уілка «Сім тез про штучний інтелект та природну мову» висловлюється вкрай скептичне ставлення до основних положень та результатів теорії фреймів. Й. Уілкс вважає, що фрейми виявляються надто конкретними структурами, у той час як актуальним завданням досліджень у галузі моделювання розуміння природної мови залишається створення загальної теорії репрезентації знань. Якщо розвивати далі фреймовий підхід у такому ж напрямі, то, на думку Й. Уілкса, потрібно буде постійно розробляти все нові і нові фрейми: від ресторанів та універмагів до виготовлення їжі, садівництва тощо.

Ще однією вадою фреймового підходу Й. Уілкс вважає також відсутність критеріїв для вирішення питання про те, коли варто актуалізовувати знання, які містяться у фреймі ,що тільки вносить плутанину в аналіз тексту. Інакше кажучи, йдеться про заперечення механічного принципу застосування фреймів. На підтвердження своєї думки Й. Уілкс наводить такий приклад: «По дорозі до ресторану «Орфей» Джон зайшов до універмагу. І весь час думав про ритуали ініціації, які він побачив у телепрограмі». Якщо для розуміння цього тексту, розмірковує Й. Уілкс, механічно вжити метод фреймів, то для цих речень були б вибрані чотири великих фрейми: «ресторани», «універмаги», «ритуали ініціації», «телебачення», які навряд чи мають відношення до їх тлумачення.

 

 


Дата добавления: 2018-10-26; просмотров: 122; Мы поможем в написании вашей работы!

Поделиться с друзьями:


Мы поможем в написании ваших работ!