Формулювання наукової гіпотези



 

При дослідженні наукових джерел за даною темою, було визначено, що, на сьогодні хмара тегів є одним із сервісів Веб 2.0, які мають попит серед інтернет-користувачів.

Також все більше компаній починають цікавитися способами використання відео та Веб 2.0 для розвитку бізнесу, пошуку нових замовників, розширення групової роботи в трудових колективах і підвищення екологічності корпоративних комунікацій.

    Але наявні технології формування хмари тегів дійсне лише для текстового контенту.

Існуючі технології створення хмари тегів для інтерактивного відео, посилаються або на це ж відео, або ж на інше, при цьому не враховують контент іншого виду.

Науковою проблемою даного дослідження є відсутність методики розробки хмари тегів для відео контенту. Виходячи з аналізу літературних джерел, можна сказати про те, що виявлена наукова проблема дійсно актуальна на сьогоднішній день і вимагає розв'язку.

Тому, була сформульована гіпотеза, тобто попереднє теоретичне припущення про можливі закони і закономірності в даній предметної області.

Гіпотеза – це наукове припущення про закономірного зв'язку явищ, що містить елементи новизни і оригінальності.

Гіпотеза потрібна для того, щоб задати вірний напрям і обсяг розробок, визначити, які факти слід збирати, які літературні джерела вивчати, які експерименти проводити.

Гіпотеза – якщо створити відео, яке б могло містити в собі хмару тегів, то інформація буде більш вмісткою та більш сконцентрованою,    і, як наслідок, користувачів даного ресурсу буде більше.

Дана гіпотеза є загальною гіпотезою, бо це припущення про закономірності, які стосуються всієї множини явищ відповідної предметної сфери.

Також вона є описовою, бо це припущення про форму зв'язку між спостережуваними предметами і явищами.

 

Методика створення інтерактивного відео, що супроводжується хмарою тегів

 

Якщо раніше були популярними інформаційно-пізнавальні сюжети хронометражем 1,5–2 хвилини, орієнтуючись на запит аудиторії в короткому динамічному відео, то ця методика дозволяє створювати відео, в яких можна розповідати довгі історії з відгалуженнями від основного сюжету. І це комфортно для сучасного споживача – він обирає для себе тільки те, що йому дійсно цікаво.

Виходячи з основних положень, методика включає наступні етапи:

1) визначення предметної області;

2) визначення категорій тегів за темою:

максимально можлива кількість тегів;

розробка анкети;

аналіз зібранної інформації;

визначення основних тегів за темою;

ієрархія тегів шляхом визначення категорій тегів методом кластерного аналізу;

3) метод відображення тегів на відео;

4) створення відео;

5) створення хмари тегів;

6) поєднання хмари тегів із відео.

Для того, щоб розумно інтегрувати хмару тегів до відео, необхідно переконатися в тому, що відео та хмара тегів співвідносяться. Для цього треба зробити вибір та аналіз певної предметної області.

Наступним етапом реалізації сценарію є виявлення головних тегів, які будуть утворювати хмару тегів. Для цього необхідно зробити опитування      з даної предметної області для того, щоб знати найбільш часто згадувані ключові слова за темою.

Для виконання цього етапу було обрано метод анкетування.

Анкетування це один із методів опитування.

Опитування – метод збору соціальної інформації про досліджуваний об'єкт підчас безпосереднього (інтерв'ю) чи опосередкованого (анкетування) соціально-психологічного спілкування соціолога та респондента через реєстрацію відповідей респондентів на сформульовані запитання.

Методи опитування поділяються, в свою чергу, на: анкетування й інтерв'ювання.

Відповідно, анкета – це тиражований, упорядкований за формою та змістом набір запитань у формі опитувального листка.

Анкетування має суттєву перевагу: опитування максимально формалізується, й таким чином забезпечується висока порівняльність відомостей та їх машинне опрацювання; анкетування забирає часу менше, ніж інтерв'ю, не потребує залучення великої кількості осіб, які його здійснюють, анкети можна роздавати через представників адміністрації чи вислати поштою; витримується вимога анонімності відповідей, що підвищує їхню достовірність. Анкетування – найбільш поширений і ефективний метод збору первинної інформації.

Анкетування є одним з найбільш інформативних засобів опитування, як правило, виконується заочно, тобто без прямого й безпосереднього контакту інтерв'юера з респондентом. Анкетування доцільне у двох випадках: коли потрібно запитати велику кількість респондентів за відносно короткий час, та коли респонденти повинні ретельно подумати над своїми відповідями, маючи перед очами поставлені запитання.

Анкетування здійснювалось індивідуально за допомогою електронної пошти (заочне). Для отримання більш об’єктивного опитуванню та отримання більш ефективних результатів, анкети було запропоновано заповнити експертам з даної предметної сфери.

Існує перелік вимог до експертів.

По-перше, експерт – якщо він фахівець, від якого чекають прогнозних оцінок, – не повинен бути особою, що приймає рішення на основі отриманої інформації. Він може бути тільки радником того, хто бере на себе відповідальність за постановку мети, план, програму, проект, взагалі за будь-які рішення. В іншому випадку виникає спокуса "підпорядкування" експертизи заздалегідь запланованим рішенням, прикриття волі керівника посиланням на "думку експертів".

По-друге, не кожен фахівець – навіть вельми авторитетний в своїй області, може бути в експертній групі, тим більше для цілей соціального прогнозування. Деякі з них при обширних знаннях не володіють якостями, необхідними для члена експертної групи, не здатні давати адекватні оцінки і можуть лише дезорганізувати роботу, особливо при очних опитуваннях. Досвідом вироблені складні прийоми відбору експертів. Суворе дотримання процедурі таких прийомів обов'язково для кожного організатора дослідження.

Перший критерій відбору експертів – ступінь компетентності експерта. Здебільшого орієнтуються на найбільш "прості" показники – вчений ступінь або звання, стаж роботи за фахом. Але обидва показники не завжди є мірилом компетентності. Тому доводиться вдаватися до додатковим показникам – службове становище, число опублікованих робіт, число посилань на ці роботи в літературі, оцінка робіт науковою громадськістю і ін Постає проблема комплексності показників компетентності експерта.

Другий критерій відбору експертів тісно пов'язаний з першим. Він припускає, що експерт знає "останнє слово" сучасної науки і практики в тих областях, які є предметом експертизи. Тут важливий якісний аналіз наукової або практичної діяльності експерта і його праць.

Третій компонент відбору – оптимальне поєднання вузької спеціалізації і загального кругозору експерта. Для цього знову-таки необхідний якісний аналіз діяльності та наукових праць експерта.

Четвертий критерій відбору – оптимальне поєднання індивідуальних якостей експертів як наукових або практичних працівників. Сюди відносяться здібності експерта до аналізу і синтезу досліджуваних проблем, до об'єктивної всебічної оцінки проблеми без надмірного ухилу в бік оптимістичних або песимістичних відповідей з чисто психологічних мотивів, стійкість його наукових поглядів, але разом з тим достатня гнучкість мислення, здатність змінити точку зору під впливом нових фактів і аргументів, вміння переробляти, засвоювати і формувати якісно нову наукову інформацію.

П'ятий критерій відбору – високі моральні якості експерта. Цей критерій дуже складний. Ясно, однак, що без належного морального рівня експерта інші його якості можуть виявитися марними, здатними лише збільшити небезпеку отримання псевдопрогноза.

Кожному із респондентів пропонувалося навести найбільш важливі ключові слова за обраною темою в пріоритетному порядку. Була проведена статистична обробка даних засобами MS Excel (був підрахований загальний процент відповідей), в результаті якої можна чітко виділити пріоритети. Отримані результати анкетування, відображені в таблиці Б.1. В результаті було відібрано 15 найбільш згадуваних ключових слів.

 

Таблиця 1.2

 

Кількість тегів для основних відео-форматів

 

Формат Ширина Висота Співвідношення Суммарно пікселей Кількість тегів в хмарі тегів
PAL 768 576 4:3 442 368 8
NTSC 720 480 3:2 345 600 8
QVGA 320 240 4:3 76 800 6
SQ/360p 480 360 4:3 172 800 7

HQ/SD/480p

640 480 4:3 307 200

8

852 480 16:9 408 906
HD/720p 1280 720 16:9 921 600 12
HD/1080i 1920 1080 16:9 2 073 600 15
Full HD/1080p 1920 1080 16:9 2 073 600 15

2K

2048 1080 >17:9 2 211 840

>15

2048 1536 4:3 3 145 728
4K 4096 2160 >17:9  

 

Для визначення максимально можливої кількості тегів, було вирішено застосувати формулу (1.1):

  Кількість тегів = ʄ (форматиі),        (1.1)

де і = 1…9.

Для того, щоб хмара тегів, вбудована до відео, була найбільш продуктивною, необхідно обрати кількість відображаючихся тегів на відео. Для формату відео PAL найбільш доцільним є використання 8 тегів на екрані (табл. 1.2).

В результаті розрахунку значення М, серед 15 найбільш згадуваних тегів, було обрано 8 найбільш згадуваних ключових слів (табл. 1.3),

де З – згадування тегу в анкетах;

П – середнє значення пріоритетності даного тегу в кожній окремій анкеті (за шкалою від 15 до 1);

М – середнє значення тегу з урахуванням згадування тегу в анкеті та середнє значення пріоритетності даного тегу в кожній окремій анкеті.

 

Таблиця 1.3

 

Найбільш згадувані теги

 

№ п/п Тег З П М
1 История игры 2 1,5 1,75
2 Развитие 1 2 1,5
3 Суть игры 3 3,2 3,1
4 Регламент игры 2 1 1,5
5 Голосование 8 4 6
6 Перестрелка 6 0,5 3,25
7 Мирный житель 12 7 9,5
8 Шериф 11 10,5 10,75
9 Мафия 9 9,5 9,25
10 Дон 11 6 8,5
11 Критическая ситуация 3 1,1 2,05
12 Договорка мафии 3 1,2 2,1
13 Убийство 6 0,8 3,4
14 Правила 4 0,2 2,1
15 Ведущий 3 1 2

 

З метою виділення категорій ключових слів, зібрана інформація була проаналізована таким многомірним методом обробки данних, як кластерний аналіз.

«Кластерный аналіз» – це загальна назва безлічі обчислювальних процедур, що використовуються при створенні класифікації. У результаті роботи із процедурами утворюються «кластери» або групи дуже схожих об'єктів.

Існує кілька методів кластерного аналізу, але для розв'язку завдання виділення категорій ключових слів були обрані ієрархічні агломеративні методи. Ця група методів характеризується послідовним об'єднанням вихідних елементів і відповідним зменшенням числа кластерів. На початку роботи алгоритму всі об'єкти є окремими кластерами.

На першому кроці найбільш схожі об'єкти поєднуються в кластер. На наступних кроках об'єднання триває доти, поки всі об'єкти не будуть становити один кластер. Ієрархічні методи кластеризації відрізняються правилами побудови кластерів. У якості правил виступають критерії, які використовуються при розв'язку питання про «схожість» об'єктів при їхньому об'єднанні в групу (агломеративні методи). Ієрархічні методи кластерного аналізу використовуються при невеликих обсягах наборів даних. Перевагою ієрархічних методів кластеризації є їхня наочність.

У методі деревоподібної кластеризації передбачені різні правила ієрархічного об'єднання в кластери. У нашому випадку раціонально обрати метод Уорда.

До вихідних даних записуються дані значень показників З та П. Вони позначаються, відповідно – х1 та х2.

Вихідні дані надано на рис. 1.9:

 

 

Рис. 1.9. Вихідні дані

 

Як відстань між об'єктами було прийнято Махеттенську відстань (cityblock). Відстань між кластерами була визначена за принципом «далекого сусіда» і «середнього зв'язку».

 

 

Рис. 1.10. Значення стандартизації даних

 

Визначення значення стандартизації даних (рис. 1.10):

Для проведення стандартизації необхідно розрахувати хср і середньоквадратичне відхилення за формулою (1.2):

  σ=√Σ(x-хср)^2/(n-1),    (1.2)

де σ – стандартизація;

x - значення кожного показника;

xср - середнє значення кожного показника.

Стандартизоване значення для кожного zij визначається за формулою (1.3):

  Zij = (xij-хсрj) / σj,        (1.3)

де Zij - стандартизоване значення для кожного елемента;

σj – стандартизація кожного показника;

xij – елемент матриці;

хсрj - середнє значення кожного показника.

Далі було розраховано відстані між об'єктами. Відстань між об'єктами було прийнято Махеттенське (cityblock), яке визначається за наступною формулою (1.4):

  dij = Σk = 1 | xik-xjk |   (1.4)

На першому етапі, в клітинку вставляємо формулу розрахунку відстаней, копіюємо для всіх значень, а потім видозмінюємо, де необхідно формулу, в залежності від осередку. В результаті отримуємо матрицю відстаней (рис. 1.11). У цій матриці визначаємо мінімальне значення і заносимо його в таблицю (рис. 1.12). Потім стовпець і рядок, в яких знаходиться мінімальне значення відстані викреслюємо і об'єднуємо з попереднім стовпцем і рядком. При цьому перераховуємо заново матрицю відстаней методом «далекого сусіда» за наступною формулою (1.5):

  dnspdps+ αqdqs+βdpq+γ| dps+ dqs|,    (1.5)

де α=0,5;

β=0;

γ=0,5.

 

 

Рис. 1.11. Етап 1. Матриця відстаней

 

 

Рис. 1.12. Об'єднання об'єктів і мінімальні відстані між ними

 

Після того як об'єкти були об'єднані, в нашому випадку 3 та 4, і перераховані відстань між усіма об'єктами (рис. 1.13), визначаємо заново мінімальне значення відстані, викреслюємо цей стовпець і рядок. Ці дії виконуються доти, поки всі об'єкти не будуть об'єднані і в необхідну кількість кластерів. Результати виконання етапів показані на рис. 1.14.

 

 

Рис. 1.13. Етап 2. Перерахунок відстаней між об'єктами

 

 

Рис. 1.14. Етапи 3-7. Об'єднання об'єктів

 

За результатами кластеризації була побудована дендограма (рис. 1.15). Одже, всі об’єкти були розділені на 3 кластирі.

 

 

Рис. 1.15. Дендограма 1

 

Щоб остаточно підтвердити, що об’єкти були правильні розбито на кластири, був виконаний перерахунок відстаней між об'єктами при їх об'єднанні методом «середнього зв'язку».

Відстань між об'єктами за методом «середнього зв'язку» розраховується за наступною формулою (1.6):

  dnspdps+ αqdqs+βdpq+γ| dps+ dqs|,    (1.6)

де αp = np / (np + nq);

αq = nq / (np + nq);

β = 0;

γ = 0.

Як і в попередньому методі заповнюючи матрицю відстаней, знаходиться мінімальна відстань між об'єктами, ці об'єкти об'єднуються, а відстані перераховуються. Результати проведення етапів 1-7 показані на рис. 1.17. На рис. 1.16 показано таблиця об'єднання об'єктів на кожному етапі і мінімальна відстань між ними.

 

Рис. 1.16. Об'єднання об'єктів і мінімальна відстань між ними

 

 

Рис. 1.17. Етапи об'єднання об'єктів і перерахунку відстаней методом «середнього зв'язку»

 

За результатами кластеризації була побудована дендограма (рис. 1.18).

 

 

 

Рис. 1.18. Дендограма 2

 

Одже, за результатами обох методів всі об’єкти були розділені на 3 кластери.

Наступним етапом реалізації сценарію розробки методики є вибір методу відображення тегів на відео.

В результаті виявлених в результаті літературного огляду принципів, їх можно застосувати в розроблювальній методиці.

Одже, теги в хмари тегів будуть розділені на три групи (3 кластири). Перша група, де будуть знаходитися найбільш важливі теги будуть відрізнятися кольором та кеглем шрифту. Друга, менш важлива – тільки кольором, і третя не буде відрізнятися.

Для того, щоб відео найбільш чітко відображало суть тега, необхідно створити або провести пошук найбільш відповідного відео. Слід зауважити, що необхідно створювати або знайти відео для кожного тегу. Далі треба провести вибір місця на екрані відео для відображення хмари тегів.


Висновки до розділу 1

 

В науково-дослідному розділі, був проведен аналіз поняття хмари тегів: історія появи, основні цілі створення, шляхи реалізації, ознаки та типи хмари тегів.

Також в цьому розділі були сформульовані основні наукові елементи – ціль, об’єкт та предмет дослідження.

Актуальність вибраної теми, аналіз програмного забезпечення, яке дозволяє створити хмару тегів та інтегрувати її до відео, розробка методики.

Таким чином, порівнюючі сервіси Веб 1.0 та Веб 2.0, вдалося встановити ключовий принцип та відмінність Веб 2.0: чим більше людей використовує сервіс, тим автоматично він стає краще.

Були обрані дисципліни для практичної реалізації кожної із вибраних задач виконання магістерської кваліфікаційної роботи.

В ході літературного огляду, було сформульовано та класифіковано авторське поняття «хмари тегів».

Виявлена наукова проблема даного дослідження – відсутність методики розробки хмари тегів для відео контенту. Виходячи з аналізу літературних джерел, можна сказати про те, що виявлена наукова проблема дійсно актуальна на сьогоднішній день і вимагає розв'язку.

На основі виявленної наукової проблеми була сформульована, класифікована та обґрунтована гіпотеза дослідження.

Також в першому розділі був обраний науковий метод дослідження –кластерний аналіз.

На основі метода, була створена та описана методика створення інтерактивного відео, що супроводжується хмарою тегів.

Створення такої методики дасть багато переваг як для пересічних користувачів, так і для розробників. Інтерактивне відео, яке буде мати свою хмару тегів буде привертати увагу своєю новизною нових користувачів чи то Інтернет-ресурсу, чи то якогось мультимедійного видання. Його можна буде використовувати в рекламних цілях. Також ця технологія допоможе користувачеві швидше зрозуміти чи потрібне йому ця інформація, чи ні.

 


Дата добавления: 2018-02-15; просмотров: 216; ЗАКАЗАТЬ РАБОТУ