Требования к развитию Подсистемы сбора информации из источников СМИ и социальных медиа



Требования к функции «Сбор контента из сервисов для мгновенного обмена сообщениями»

Подсистема сбора информации из источников СМИ и социальных медиа должна позволять собирать и отображать в АРМ Аналитика открытые и общедоступные данные из источников-мессенджеров (сервисов для мгновенного обмена сообщениями), в частности, из источника Telegram.

К таким данным относятся:

- информация о канале распространения сообщения;

- информация об авторе сообщения;

- информация о тексте сообщения;

- информация о метриках сообщения: количество просмотров.

Для получения данных Система должна использовать существующие API источников либо иные инструменты сбора.

Данные метрики должны храниться в Системе и отображаться пользователю АРМ Аналитика для каждого сообщения из Интернет-СМИ или для главного сообщения кластера, если отчёт, сформированный пользователем, имеет признак группировки сообщений.

Требования к функции «Сбор метрик информационных сообщений из СМИ»

Подсистема сбора информации из источников СМИ и социальных медиа должна позволять собирать и отображать в АРМ Аналитика информацию о метриках информационных сообщений, размещённых в Интернет-СМИ. В зависимости от особенностей конкретного источника, к метрикам сообщений могут относиться:

- количество комментариев;

- количество отметок «Нравится»;

- количество репостов в социальных сетях.

Метрики представляют собой количественные показатели, расположенные на веб-страницах с исходными информационными сообщениями.

Данные метрики должны храниться в Системе и отображаться пользователю АРМ Аналитика для каждого сообщения из Интернет-СМИ или для главного сообщения кластера, если отчёт, сформированный пользователем, имеет признак группировки сообщений.

Требования к функции «Сбор метрики «Количество просмотров»

Подсистема сбора информации из источников СМИ и социальных медиа должна позволять собирать и отображать в АРМ Аналитика информацию о количестве просмотров информационного сообщения для тех источников, где предусмотрена публикация таких сведений.

Данная метрика представляет собой количественный показатель, расположенный на веб-странице с исходным информационным сообщением.

Данная метрика должна храниться в Системе и отображаться пользователю АРМ Аналитика для каждого сообщения или для главного сообщения кластера, если отчёт, сформированный пользователем, имеет признак группировки сообщений.

Требования к развитию Подсистемы первичной обработки информации

Требования к функции «Определение цитирования информационного объекта»

Функция определения цитирования информационного объекта должна быть реализована в виде модуля, предназначенного для выявления фрагментов публикаций в различных информационных источниках, в которых содержатся отсылки к прямой или косвенной речи сущностей, являющихся информационными объектами Системы.

Для выявления таких фрагментов должен быть создан список характеризующих выражений, каждое из которых может применяться ко всем или к части информационных объектов. Характеризующие выражения должны отражать различные языковые способы передачи в тексте сообщений прямой или косвенной речи.

В качестве критериев применимости каждого характеризующего выражения к объекту должны выступать:

- применимость к объекту типа «Персона»;

- применимость к объекту типа «Организация»;

- использование характеризующего выражения перед упоминанием объекта в тексте публикации;

- использование характеризующего выражения после упоминания объекта в тексте публикации

- максимальное расстояние от характеризующего выражения до первого символа объекта;

- максимальное расстояние от последнего символа объекта до характеризующего выражения.

Требования к функции «Выявление информационных трендов»

Функция выявления информационных трендов должна быть реализована в виде модуля, предназначенного для определения качественных и количественных характеристик распространения информационного повода в источниках СМИ и социальных медиа.

Для определения таких характеристик в качестве объекта исследования используется группа информационных сообщений, объединенных между собой по признаку сходства. Для каждой такой группы выявляются зависимости и параметры, позволяющие отнести процесс распространения информационного повода к категории «тренд» согласно сформированным критериям тренда.

В качестве параметров, характеризующих информационный тренд, должны быть определены и выступать:

- дата начала тренда;

- длительность тренда;

- периодический (ежедневный/еженедельный/ежемесячный) прирост количества информационных сообщений в тренде;

- периодический (ежедневный/еженедельный/ежемесячный) прирост метрик информационных сообщений в тренде;

- периодический (ежедневный/еженедельный/ежемесячный) прирост аудитории сообщений в тренде;

- период наибольшего развития тренда;

- дата начала угасания тренда.


Дата добавления: 2018-06-27; просмотров: 392; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!