Форма 3-показатели «О некоторых показателях деятельности таможенных органов» — ежемесячная



Отчет передается в электронном формате и на бумажном носителе. Формирование отчетов производится путем заполнения таблицы в редакторе Microsoft Excel, так как специальный комплекс программных средств (КПС) пока не создан.

Сбор и обработку данных для отчета каждый исполнитель осуществляет средствами для обработки так называемых «гибких запросов», которые ему доступны. В числе таких КПС можно назвать «Гибкие запросы», АСТО–«Анализ» и другие.

В отчетности отражаются показатели количества оформленных транспортных средств – «Всего», «Вывоз» и «Ввоз» по видам транспорта в соответствии с Классификатором видов транспорта и транспортировки товаров.

Графа отчета «Вывоз» содержит сведения о транспортных средствах, на которые товары были погружены для вывоза с таможенной территории России в соответствии с каким-либо экспортным режимом. Здесь же учитываются вывозимые в качестве товара самодвижущиеся транспортные средства. При этом легковые транспортные средства, вывозимые физическими лицами, не учитываются.

В графе отчета «Ввоз» содержатся сведения о транспортных средствах, на которых находились импортные товары по прибытии их в регион деятельности таможенного органа для завершения таможенного оформления. Здесь же учитываются ввозимые в качестве товара самодвижущиеся транспортные средства. При этом легковые транспортные средства, ввозимые физическими лицами, не учитываются.

В графе отчета «Всего» указывается сумма значений граф «Вывоз» и «Ввоз».

Разбивка по видам транспорта и подсчет транспортных средств производится на основании сопоставления сведений, источниками которых являются:

–   журналы регистрации транспортных средств;

–   предоставляемая таможенным органам отчетность владельцев СВХ;

–   графы 18 и 26 ГТД – для вывозимых товаров и для товаров, ввезенных в регион деятельности таможенного органа с применением процедуры внутреннего таможенного транзита;

–   графы 21 и 25 ГТД – для ввозимых товаров, если основное таможенное оформление производится в месте ввоза товаров.

Учет транспортных средств ведется по дате выпуска перемещаемых на них товаров. Следовательно, сведения о конкретном транспортном средстве должны попасть в отчетность за тот период, когда перемещаемые на нем товары были полностью оформлены.

Форма 4-пп «Основные показатели работы пунктов пропуска через государственную границу РФ, расположенных в регионе деятельности таможенного органа» — квартальная

Вся информация указывается в разбивку по направлениям: ввоз – «в Россию» и вывоз – «из России».

Отчет отражает сведения за отчетный период, касающиеся количества перемещенных грузовых, пассажирских и легковых транспортных средств, а также количества физических лиц, проследовавших через границу в обоих направлениях.

Сбор, автоматизированная обработка данных и формирование отчетов по форме 4-пп ведется посредством КПС «Паспорт таможенного органа». Отчет передается в электронном формате.

 

 

Резюме

Помимо статистики внешней торговли таможенная служба России устанавливает порядок ведения и ведет специальную таможенную статистику, данные которой используются исключительно в таможенных целях для обеспечения решения задач, возложенных на таможенные органы.

Формирование достоверной исходной статистической информации возложено на таможенные посты (таможни). Оттуда вся имеющаяся информация направляется в вышестоящие таможенные органы как в виде первичных документов (ГТД, ТПО, ДКД и пр.), так и в виде установленных форм отчетности.

Предметом специальной таможенной статистики является изучение деятельности таможенных органов, выраженной статистическими показателями. Показатели специальной таможенной статистики – это фактические данные, полученные в результате статистического или бухгалтерского учета в сфере таможенного дела.

Методологии специальной таможенной статистики в целостном и законченном виде пока не существует вследствие недостаточности накопленного опыта и знаний в этом направлении. Поэтому идет процесс постоянного совершенствования как самих форм отчетности, так и методических указаний и рекомендаций, прилагаемых к этим формам.

По срокам статистические формы отчетности могут быть декадными, ежемесячными, квартальными, полугодовыми, годовыми.

Объектами исследования специальной таможенной статистики являются основные направления деятельности таможенных органов: итоги декларирования, таможенные платежи, валютный контроль, перемещение транспортных средств и физических лиц через таможенную границу России, правоохранительная деятельность, кадровое обеспечение, технические средства и связь и другие.

Статистика декларирования предназначена для управления деятельностью таможенных органов и базируется на содержании первичных документов – ГТД, представленных участниками ВЭД. В настоящее время не существует в отдельном виде специальных форм отчетности по декларированию товаров, но показатели статистики декларирования рассчитываются в таких отчетах, как: 2-загрузка, 4-пп, 10-дкм и др.

Статистика таможенных платежей предназначена для контроля за перечислением таможенных платежей в федеральный бюджет и для выявления резервов по увеличению перечисляемых платежей. Показатели статистики таможенных платежей рассчитываются в отчетах 4–пл, 5–физ, 7–авто и пр. Источники формирования данных для этих отчетов – ГТД, ТПО, иные платежные документы.

Статистика валютного контроля предназначена, во-первых, для содействия совершенствованию законодательства о валютном контроле, во-вторых, для подготовки правовых актов по реализации контрольных функций таможенной службы в сфере валютного контроля, в-третьих, для укрепления взаимодействия таможенной службы России с другими федеральными органами исполнительной власти в осуществлении валютного контроля и борьбы с отмыванием «грязных» денег, в-четвертых, для разработки единых принципов осуществления валютного контроля таможенными службами государств – участников Таможенного союза. К статистическим формам отчетности относятся 18-контроль, 21-займ, 1-вал. Источниками данных для этих отчетов являются: ГТД, пассажирские декларации ТД-6, материалы проверок и прочие документы.

Статистика перемещения транспортных средств и физических лиц, как следует из ее названия, предназначена для учета транспортных средств и физических лиц, следовавших в Российскую Федерацию или из Российской Федерации. Учет физических лиц ведется в целом, без разбивки на категории, например, пассажиров и членов экипажей транспортных средств, российских и иностранных граждан и т.д. Показатели статистики перемещения транспортных средств и физических лиц содержатся в форме 3-показатели, а также в комплексных формах отчетности 7-авто, 4-пп. Источниками данных для этих отчетов являются журналы регистрации транспортных средств, предоставляемая таможенным органам отчетность владельцев СВХ, ГТД.

 

Вопросы для контроля

1.  Что изучает специальная таможенная статистика?

2.  В чем состоит различие между статистикой внешней торговли и специальной таможенной статистикой в области методологического обеспечения?

3.  Назовите формы отчетности, показатели и источники данных статистики таможенных платежей.

4.  Перечислите формы отчетности, показатели и источники данных статистики валютного контроля.

5.  Назовите комплексные формы отчетности. По каким основным направлениям деятельности таможенной службы отражены показатели в этих отчетах?

 

Тесты

1.  Статистика декларирования включает в себя формы отчетности:

а) ТД-6,

б) 2-загрузка,

в) 7-ГТД,

г) 4-пп,

д) 3-показатели.

 

2.  Статистика таможенных платежей включает в себя формы отчетности:

а) 7-авто,

б) 2-пл,

в) 4-пл,

г) 5-физ,

д) 5-пл.

3.  Основные задачи статистики таможенных платежей:

а) учет транспортных средств, ввезенных в Россию и вывезенных из России,

б) контроль обоснованности платежей в иностранной валюте,

в) контроль за перечислением таможенных платежей в федеральный бюджет,

г) выявление резервов по увеличению платежей, перечисляемых в федеральный бюджет,

д) управление деятельностью таможенных органов.

 


Глава 9. Анализ структуры в таможенной статистике

 

Структура. Этапы изучения структуры. Ряды распределения и ряды динамики. Атрибутивный ряд распределения. Элементы структуры и принципы их формирования. Линейный коэффициент абсолютных структурных сдвигов. Квадратический коэффициент абсолютных структурных сдвигов. . Квадратический коэффициент относительных структурных сдвигов. Цепные и базисные показатели структурных сдвигов. Коэффициент монотонности. Вариационный ряд распределения и его элементы. Размах вариации. Среднее линейное отклонение. Дисперсия. Среднеквадратическое отклонение. Коэффициент вариации. Меры вариации.

 

9.1. Основные понятия

«Структура» (лат.) означает строение, расположение.

Структура в статистике– это внутреннее строение статистической совокупности, состоящей из отдельных частей, каждая из которых обладает устойчивыми внутригрупповыми связями при сохранении основных свойств, характеризующих данную совокупность как единое целое.

Структура массовых явлений (например, внешней торговли) имеет свойство меняться со временем как в количественном, так и в качественном отношении. Так, с течением времени меняются объемы торгового оборота с отдельными странами-контрагентами, появляются новые страны в географическом распределении экспорта-импорта.

От структуры внешней торговли во многом зависит ее эффективность, так как изменения в структуре приводят к изменению тенденций развития. Например, нередки случаи, когда в зоне деятельности таможен Дальневосточного региона складывается активный баланс внешней торговли, что расценивается положительно. Но при этом товарная структура экспорта носит сырьевую направленность, а импортируются, в основном, продукты питания, одежда, обувь, автомобили и т.д., то есть для России существует реальная угроза стать сырьевым придатком промышленно развитых стран. Такая внешняя торговля не может быть признана эффективной.

Анализ структуры занимает центральное место среди задач статистического анализа, в том числе, и в таможенной статистике.

Этапы изучения структуры:

1) определение количественного или качественного признака, в разрезе которого изучается структура;

2) сжатие информации посредством сводки или группировки;

3) исчисление удельных весов элементов структуры и их наглядное отображение с помощью таблиц и графиков;

4) сравнительный анализ структур по различным объектам;

5) исследование структурных сдвигов во времени.

Результатом статистического наблюдения является статистическая совокупность, представленная в виде статистического ряда – распределения или динамики, в зависимости от рассматриваемого временного промежутка.

Ряд распределения – это статистический ряд, в котором представлены данные за один период времени.

Ряд динамики характеризует изменение явления с течением времени.

Исследование структуры имеет смысл только для рядов распределения, причем немаловажно, какой признак – количественный или качественный – положен в основу группировки его данных. В соответствии с этим ряды распределения делятся на два типа: атрибутивные и вариационные.

Ряд распределения называется атрибутивным, если в основу группировки его данных положен качественный признак.

Если в основу группировки данных ряда распределения положен количественный признак, то ряд называется вариационным.

При построении атрибутивных рядов распределения формируются элементы структуры – группы значений, объединенных по некоторому качественному признаку.

Для таможенной статистики внешней торговли характерно изучение структуры внешнеторгового оборота (экспорта или импорта), представленного в натуральном или стоимостном выражении.

В зависимости от целей исследования можно анализировать структуру внешнеторгового оборота по следующим признакам:

1) позиции ТН ВЭД России;

2) страны мира и группы стран;

3) категории (формы собственности) участников ВЭД и т.д.

Для построения группировок необходимо, чтобы эти признаки были отражены в первичных документах статистического учета, то есть в ГТД.

Принципы формирования элементов структуры:

–   число групп должно быть от 2 до 12 для того, чтобы результат анализа был наглядным;

–   элементы структуры не должны пересекаться между собой;

–   сумма долей по элементам структуры должна равняться единице.

Для более наглядного описания структуры ряды принято представлять в относительных величинах (долях или удельных весах). Графически структура чаще всего изображается в виде секторной диаграммы.

Пример 1.

Рассмотрим распределение экспорта по странам в зоне деятельности Владивостокской таможни в I квартале 2002 года (таблица 9.1). Графически структуру экспорта можно представить в виде круговой (секторной) диаграммы так, как это изображено на рис. 9.1. Такое представление структуры достаточно наглядно, поскольку площадь каждого сектора соответствует доле структурного элемента в совокупности.

 

9.2. Сравнительный анализ атрибутивных рядов распределения

При сравнительном анализе атрибутивных рядов распределения в основном представляет интерес оценка величины структурных различий.

 

Количественная оценка структурных различий производится по величине среднего линейного показателя структурных различий, который называется линейным коэффициентом абсолютных структурных сдвигов (С) и определяется по формуле:

где

k – количество элементов структуры;

d1 – доля или удельный вес варианта признака в сравниваемом ряду распределения;

d0 – доля или удельный вес соответствующего варианта признака в базисном ряду распределения.

Линейный коэффициент абсолютных структурных сдвигов отражает среднее изменение удельного веса (в процентных пунктах или процентах), которое имело место за рассматриваемый период времени.

Структурные различия принято считать:

–   малыми, если С < 2%;

–   существенными, если 2% ≤ С ≤ 10%;

–   большими, если С > 10%.

Выбор базисного ряда распределения условен:

1) если ряды распределения сравниваются во времени, то за базисный удобнее принять ряд для более раннего момента времени;

2) если сравниваются ряды распределения по различным объектам (территориям, показателям и т.д.), то выбор базиса принципиального значения не имеет.

Существуют и другие показатели анализа структурных сдвигов:

 

квадратический коэффициент абсолютных структурных сдвигов (σ d 1 -d 0 )

где

n – количество элементов структуры;

d1 – доля или удельный вес варианта признака в сравниваемом ряду распределения;

d0 – доля или удельный вес соответствующего варианта признака в базисном ряду распределения;

 

квадратический коэффициент относительных структурных сдвигов (σ )

где

d1 – доля или удельный вес варианта признака в сравниваемом ряду распределения;

d0 – доля или удельный вес соответствующего варианта признака в базисном ряду распределения.

Квадратический коэффициент абсолютных структурных сдвигов имеет тот же смысл, что и линейный коэффициент абсолютных структурных сдвигов. Вместе они дают сводную оценку средней скорости изменения удельных весов элементов структуры.

Квадратический коэффициент относительных структурных сдвигов отражает средний относительный прирост удельного веса в процентах, который наблюдался за рассматриваемый период.

Пример 2.

Рассмотрим распределение экспорта и импорта по странам в зоне деятельности Владивостокской таможни в I квартале 2002 года (таблица 9.2).

Примем в качестве базисного ряд распределения экспорта и сравним с ним ряд распределения импорта. Для количественной оценки разницы в структурах двух исследуемых объектов исчислим соответствующие коэффициенты, воспользовавшись для этого вспомогательной таблицей 9.3.

Полученное значение линейного коэффициента абсолютных структурных сдвигов свидетельствует о том, что удельный вес одного варианта базисного (экспортного) и сравниваемого (импортного) рядов распределения отличаются в среднем на 22,1%, то есть существуют большие различия в географическом распределении экспорта и импорта .

Значение квадратического коэффициента абсолютных структурных сдвигов также свидетельствует, что существуют большие различия в географическом распределении экспорта и импорта, при этом удельный вес одного варианта базисного (экспортного) и сравниваемого (импортного) рядов распределения отличаются в среднем на 32,4%, то есть квадратический коэффициент гораздо резче линейного реагирует на различия в структуре .

Расчеты показали, что квадратический коэффициент относительных структурных сдвигов составил 237,3%, то есть удельный вес стоимостного объема импорта по каждому элементу структуры в среднем в 2,37 раза больше, чем удельный вес стоимостного объема экспорта по данному элементу структуры.

Аналогичные сравнения можно производить и при исследовании структурных изменений во времени. Для решения подобной задачи используются цепные или базисные показатели структурных сдвигов.

 

9.3. Анализ структурных сдвигов во времени

Линейные коэффициенты абсолютных структурных сдвигов называются цепными показателями структурных сдвигов (сцеп), если за сравниваемую структуру принят ряд распределения в отчетный период времени, а за базисную – в предшествующий период.

Цепные показатели структурных сдвигов показывают, на сколько в среднем отличается удельный вес одного структурного элемента в отчетный период времени по сравнению с предшествующим периодом.

 

С помощью цепных показателей структурных сдвигов рассчитывается средняя величина показателя структурных сдвигов (сцеп)

 

где n – число периодов наблюдения.

Изменения в структуре показателя могут быть :

–   случайными, если нет четкой тенденции в изменении удельных весов;

–   закономерными, когда удельные веса одних элементов структуры устойчиво растут за счет сокращения удельных весов других элементов.

Для определения направленности структурных сдвигов служит коэффициент монотонности ( m ).

 

Цепной коэффициент монотонности m цеп рассчитывается по формуле:

где g цеп рассчитывается так же, как и c цеп, но только для тех элементов, у которых изменение удельных весов сохранило направление по сравнению с предыдущим периодом.

Считается, что структурные сдвиги:

–   сохранили направление изменений по сравнению с предыдущим периодом, если m > 0,7;

–   изменили направление, если m < 0,3

–   случайны, если 0,3 ≤ m ≤ 0,7.

Кроме того, для анализа структурных сдвигов рассчитываются средние значения коэффициентов монотонности в период устойчивой тенденции и по всему периоду.

Аналогичный анализ может быть проведен с использованием базисных показателей структурных сдвигов.

В качестве базисной обычно берется структура в начальный период времени, в качестве сравниваемой – структура за отчетный период. Линейные коэффициенты структурных сдвигов, рассчитанные этим способом, называются базисными показателями структурных сдвигов.

Базисные показатели структурных сдвигов показывают среднее изменение одного элемента структуры по сравнению с исходной структурой в начальный период наблюдений.

При вычислении gбаз в расчет включаются те элементы структуры, изменение которых в соответствующем периоде времени имеет то же направление структурных сдвигов, что и изменение удельного веса данного элемента за весь период наблюдения.

Таким образом, базисные коэффициенты монотонности характеризуют степень соответствия направления структурных сдвигов за период времени с начала наблюдения общей тенденции структурных сдвигов за весь период наблюдения.

Рассчитывается также средний коэффициент монотонности, который характеризует степень закономерности структурных сдвигов в течение всего периода наблюдения.

Пример 3.

Проанализируем структуру экспорта по странам-контрагентам в 2000-2001 гг. в зоне деятельности Владивостокской таможни. Исходные данные представлены в таблице 9.4.

Для начала воспользуемся цепным методом. Вспомогательные расчеты представлены в таблице 9.5.

Расчеты показывают, что за один квартал удельный вес одного структурного элемента изменялся в среднем на 5,8%.

При расчете цепных коэффициентов монотонности для вычисления g цеп берутся те элементы структуры, у которых совпадают знаки структурных сдвигов в соответствующей и предыдущей строках таблицы. Результаты расчета коэффициентов монотонности свидетельствуют, что в 3-4 кварталах 2000 года направление структурных сдвигов сохранялось, в 1-2 кварталах 2001 года направление структурных сдвигов изменилось и сохранилось в 3-4 кварталах 2001 года.

Средний коэффициент монотонности за весь период составляет Мср3-8=0,573. Как видим, М3-83-4 и М3-8< М7-8 , то есть сложившаяся в 3-4 кварталах 2000 года тенденция изменилась в 1 квартале 2001 года, а затем во 2 квартале 2001 года тенденция изменилась еще раз и уже сохранялась до конца исследуемого периода.

Теперь воспользуемся базисным методом (таблица 9.6).

В данном случае сср=7,2%, то есть среднее изменение одного элемента структуры по сравнению с исходной структурой 1-го квартала 2000 года составило 7,2%.

При расчете базисных коэффициентов монотонности для вычисления g баз берутся те элементы структуры, у которых совпадают знаки структурных сдвигов в соответствующей и последней строках таблицы. Базисные коэффициенты монотонности показывают, что структурные сдвиги в 3-4 кварталах 2000 года и в 3 квартале 2001 года соответствуют общей тенденции структурных сдвигов за весь период наблюдений.

Средний коэффициент монотонности за весь период составляет Мср=0,684<0,7, что в целом свидетельствует о случайности структурных сдвигов в течение всего периода наблюдений.

 

9.4. Вариационные ряды распределения

Форма статистических распределений изучаемых показателей может быть разнообразной: в одних случаях значения признака концентрируются возле некоторого центра очень тесно, в других случаях наблюдается значительное рассеивание, хотя средние величины могут быть одинаковыми. Цель вариационного анализа – определение характера рассеивания признака.

Ряд распределения называется вариационным, если в основу группировки его данных положен количественный признак.

Всякий вариационный ряд включает в себя следующие элементы:

1) вариант xi – значение признака в ряду распределения;

2) частота mi, которая показывает, сколько раз данный вариант встречается в ряду распределения;

3) частость (доля, удельный вес, структура) wi = mi /Σ mi – показывает, сколько раз частота данного варианта встречается в ряду распределения;

4) интервал h определяет значение признака, лежащее в заданных границах.

Интервалы могут быть равными и неравными.

 

Для равных интервалов длина определяется по формуле:

где

xmax и xmin – наибольшее и наименьшее значения варианта соответственно;

k – количество интервалов.

 

Для неравных интервалов длина определяется по формуле:

 

Вариация – это изменчивость признака. Простейший ее показатель – это размах вариации, определяемый по формуле: R в = xmax–xmin.

Статистика изучает изменения признака относительно средней величины, используя средний положительный размер отклонения относительно средней величины, определяемый по формуле |xi–x ср |.

Классификация показателей вариации представлена в таблице 9.7.

Среднее линейное отклонение ( d ) применяется для анализа структурных изменений.

Из показателей вариации наиболее важными являются дисперсия и среднее квадратическое отклонение.

Дисперсия (σ2) показывает средний квадрат отклонения от средней величины. Она применяется как база расчетов по выборке и для изучения взаимосвязи, поскольку позволяет раскладывать общую вариацию показателя по факторам, что при анализе взаимосвязей весьма важно. Единственный недостаток – квадратичная размерность в отличие от размерности показателя, что мешает наглядно представить рассеивание вариантов относительно среднего.

Среднеквадратичное (стандартное) отклонение (σ) позволяет наглядно представить «ширину» распределения, поскольку все значения показателя расположены по обе стороны от среднего на расстоянии примерно 3σ. При этом среднеквадратичное отклонение измеряется в тех же единицах, что и анализируемый показатель.

Коэффициент вариации (ν) – относительный показатель, мера устойчивости вариации, отношение стандартного отклонения к средней арифметической[25]. Чем меньше этот коэффициент, тем устойчивее ряд и надежнее все выводы и оценки статистического анализа.

Меры вариации (среднеквадратическое отклонение и коэффициент вариации) изучаются вместе. Они показывают средний размер отклонения от средней величины (среднеквадратическое отклонение – в именованных единицах, а коэффициент вариации – в процентах). Считается, что:

–   вариация слабая, если ν ≤ 10%;

–   вариация умеренная, если 10% < ν < 30%;

–   вариация существенная, если ν ≥ 30%.

Если вариация слабая или умеренная, то ряд считается устойчивым, а выводы статистического анализа на основе этого ряда – достаточно надежными.

Если вариация существенная, то принято считать, что использовать результаты анализа некорректно, так как исследуемая совокупность неоднородна.

Пример 4.

Рассмотрим вариационный анализ экспортных цен на лосось тихоокеанский в зоне деятельности Владивостокской таможни в 2003 г. В целом за год была оформлена 41 товарная партия, при этом цены колебались от 0,7 до 4,0 тыс. долларов США за 1 тонну. В таблице 9.8 представлены полученные данные в виде дискретного вариационного ряда распределения, когда значения признака группировки (цены) представлены конкретными числами. значения признака ранжированы в порядке возрастания.

Для целей анализа имеет смысл перейти к интервальным рядам, когда значения признака заданы интервалами. Количество выделяемых интервалов должно быть близко к числу k=[1+3,321∙lg n]. В данном случае рекомендуемое число интервалов составляет k = [ 1+3,321∙ lg 41]=[6,356]=6. Возьмем нечетное число интервалов k =7, тогда длина интервала есть h =(4,0 – 0,7)/7=0,5.

В таблице 9.9 представлен построенный интервальный ряд распределения. Для каждого интервала рассчитываем частоту и частость wi=mi / ∑mi , а также среднее значение цены внутри интервала по формуле 2.4 (средняя арифметическая взвешенная). Используя данные гр.4 и гр. 6 таблицы 9.9, строим график распределения объема экспорта рыбы по цене (рис. 9.2), который по форме близок к нормальному.

На гистограмме видно, что вначале с ростом цены растет и количество экспортных поставок, максимальное количество – 32% от общего числа поставок рыбы оформлено по цене от 2,7 до 3,2 тыс. долларов США за 1 тонну, затем, начиная с цены свыше 3,2 тыс. долларов за тонну, количество поставок начинает снижаться. Таким образом, 54% поставок было оформлено по цене ниже 2,7 тыс. долларов за тонну.

Для построенного интервального ряда рассчитаем показатели вариации (таблица 9.10). Размах вариации показывает, что амплитуда колебаний экспортных цен на свежую и свежемороженую рыбу лососевых пород составляет 3,05 тыс. долларов, но эта характеристика не дает нам полного представления о характере вариационного ряда. Средняя цена составляет 2,47 тыс. долларов за тонну. Среднее линейное отклонение отдельных вариантов признака от средней цены составляет 0,88 тыс. долларов. Дисперсия в данном случае равна 1,04 . Тогда среднеквадратическое отклонение составит 1,02 тыс. долларов, а коэффициент вариации – 41,3%.

Вариация в данном случае существенная, поскольку коэффициент вариации больше 30%. Следовательно, исследуемая совокупность неоднородна и выводы статистического анализа на основе этого ряда – ненадежны.

Рассмотренные в этой главе примеры анализа структуры даны с целью демонстрации техники такого анализа. Аналогичные исследования можно проводить не только по данным таможенной статистики внешней торговли, но и по данным специальной таможенной статистики. Овладев техникой анализа структуры экономических процессов и явлений, опираясь на свой профессиональный опыт, можно сделать этот анализ глубоким и практически значимым.

 

Резюме

Анализ структуры занимает одно из важнейших мест среди аналитических задач, решаемых таможенной статистикой, поскольку изменения в структуре изучаемых объектов приводят к изменениям основных тенденций развития.

При обработке информации исходные данные могут быть сгруппированы по качественным или по количественным признакам, и тогда мы имеем, соответственно, атрибутивные или вариационные ряды распределения.

Для статистики внешней торговли изучение структуры по качественным (атрибутивным) признакам наиболее целесообразно по таким абсолютным показателям, как объем экспорта или импорта в натуральном либо стоимостном выражении. В качестве признаков группировки можно взять коды ТН ВЭД России, таможенные режимы, характер сделки, условия поставки и т.д.

Элементы структуры формируются в соответствии со следующимипринципами:

–   число групп должно быть от 2 до 12 для того, чтобы результат анализа был наглядным;

–   элементы структуры не должны пересекаться между собой;

–   сумма долей по элементам структуры должна равняться единице.

Для более наглядного описания структуры ряды принято представлять в относительных величинах (долях или удельных весах).

При сравнительном анализе атрибутивных рядов распределения в основном представляет интерес оценка величины структурных различий.

Количественная оценка структурных различий производится по величине таких коэффициентов, как линейный коэффициент абсолютных структурных сдвигов, квадратический коэффициент абсолютных структурных сдвигов, относительный коэффициент абсолютных структурных сдвигов.

Наиболее применим первый из них. Линейный коэффициент абсолютных структурных сдвигов отражает среднее изменение удельного веса одного элемента исследуемой структуры (в процентных пунктах или процентах) в сравнении с базисной, которое имело место за рассматриваемый период времени. Выбор базисного ряда распределения условен.

Структурные различия могут быть малыми, существенными и большими.

При исследовании структурных изменений во времени используются цепные или базисные показатели структурных сдвигов.

Линейные коэффициенты абсолютных структурных сдвигов называются цепными показателями структурных сдвигов (сцеп), если за сравниваемую структуру принят ряд распределения в отчетный период времени, а за базисную – в предшествующий период. Цепные показатели структурных сдвигов показывают, на сколько в среднем отличается удельный вес одного структурного элемента в отчетный период времени по сравнению с предшествующим периодом.

Если в качестве базисной берется структура в начальный период времени, в качестве сравниваемой – структура за отчетный период, то линейные коэффициенты структурных сдвигов, рассчитанные этим способом, называются базисными показателями структурных сдвигов. Базисные показатели структурных сдвигов показывают среднее изменение одного элемента структуры по сравнению с исходной структурой в начальный период наблюдений.

Для определения направленности структурных сдвигов рассчитывается коэффициент монотонности.

Методы анализа вариационных рядовраспределения в таможенной статистике используются, в основном, при анализе цен. Такой анализ весьма важен при оценке эффективности внешней торговли.

Всякий вариационный ряд включает в себя элементы: вариант xi – значение признака в ряду распределения; частота mi, которая показывает, сколько раз данный вариант встречается в ряду распределения; частость (доля, удельный вес, структура) wi , которая показывает, сколько раз частота данного варианта встречается в ряду распределения; интервал h определяет значение признака, лежащее в заданных границах.

Интервалы могут быть равными и неравными.

Вариация – это изменчивость признака. При изучении вариации рассчитываются такие показатели, как размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое (стандартное) отклонение, коэффициент вариации.

Наиболее важными из них являются дисперсия и среднее квадратическое отклонение, поскольку они обладают свойством минимальности относительно средней арифметической.

Дисперсия показывает средний квадрат отклонения от средней величины. Она применяется как база расчетов по выборке и для изучения взаимосвязи, поскольку позволяет раскладывать общую вариацию показателя по факторам. Единственный недостаток – квадратичная размерность, что мешает наглядно представить рассеивание вариантов относительно среднего.

Среднеквадратичное (стандартное) отклонение исчисляется как корень квадратный из дисперсии и позволяет наглядно представить «ширину» распределения. При этом среднеквадратичное отклонение измеряется в тех же единицах, что и анализируемый показатель.

При сравнительном анализе двух и более совокупностей по степени вариации данных возникает проблема, связанная с единицами измерения признаков элементов различных совокупностей или с ситуацией, когда средние совокупностей значительно отличаются друг от друга. Для решения этой проблемы вводится относительная характеристика – коэффициент вариации. Он равен отношению стандартного отклонения к средней арифметической.

Коэффициент вариации – это мера устойчивости вариации. Чем меньше этот коэффициент, тем устойчивее ряд и надежнее все выводы и оценки статистического анализа.

Меры вариации (среднеквадратическое отклонение и коэффициент вариации) изучаются вместе. Они показывают средний размер отклонения от средней величины (среднеквадратическое отклонение – в именованных единицах, а коэффициент вариации – в процентах). Считается, что вариация может быть слабой, умеренной и существенной.

При слабой и умеренной вариации ряд считается устойчивым, а выводы статистического анализа на основе этого ряда – достаточно надежными. При существенной вариации использовать результаты анализа на базе данного ряда распределения нельзя, т.к. исследуемая статистическая совокупность неоднородна.

 

Вопросы для контроля

1.  Что такое ряд распределения? В чем заключается разница между атрибутивными и вариационными рядами распределения?

2.  По каким принципам строится структура? Приведите пример структуры.

3.  Какие показатели используются для количественной оценки структурных различий?

4.  Какими методами анализируются структурные сдвиги во времени?

5.  С какой целью проводится вариационный анализ?

6.  Назовите показатели вариации и меры вариации. Что объединяет такие характеристики, как среднеквадратичное отклонение и коэффициент вариации?

 

 

Тесты

1.  Структура формируется по следующим принципам:

а) элементы структуры должны пересекаться между собой,

б) сумма по элементам структуры должна равняться целому,

в) число групп должно быть от 3 до 9,

г) элементы структуры не должны пересекаться между собой,

д) число групп должно быть от 2 до 12,

е) сумма по элементам структуры не должна превосходить целого.

 

2.  Атрибутивный ряд распределения – это статистический ряд, у которого:

а) в основу группировки данных положен количественный признак,

б) данные могут быть сгруппированы и по качественным, и по количественным признакам,

в) представлены данные за один период времени,

г) в основу группировки данных положен качественный признак,

д) представлены данные за несколько временных периодов.

 

3.  Структурные различия принято считать существенными, если:

а) линейный коэффициент абсолютных структурных сдвигов изменяется в пределах от 2 до 10%,

б) квадратический коэффициент абсолютных структурных сдвигов изменяется в пределах от 2 до 10%,

в) линейный коэффициент абсолютных структурных сдвигов более 10%,

г) квадратический коэффициент относительных структурных сдвигов менее 2%,

д) квадратический коэффициент абсолютных структурных сдвигов более 10%.

 

4.  Вариация считается умеренной, если :

а) коэффициент вариации не менее 30%,

б) коэффициент вариации не более 10%,

в) среднеквадратичное отклонение изменяется в пределах от 10 до 30%,

г) среднеквадратичное отклонение не превосходит 10%,

д) коэффициент вариации изменяется в пределах от 10 до 30%.

 


Глава 10.   Анализ динамики в таможенной статистике

 

Динамический ряд и его элементы. Классификация рядов динамики. Сопоставимость уровней, полнота, однородность и устойчивость ряда. Смыкание рядов динамики. Средний уровень ряда. Абсолютный прирост. Коэффициент роста. Темп роста. Коэффициент прироста. Темп прироста. Абсолютное значение 1% прироста. Темп наращивания. Средний абсолютный прирост. Средний коэффициент роста. Основная тенденция развития. «Кривые роста». Критерии нулевого среднего, случайности, независимости и нормальности последовательных остатков. Максимальная ошибка. Средняя абсолютная ошибка. Остаточная дисперсия. Средняя квадратическая ошибка. Точечный прогноз. Доверительный интервал. Индексы сезонности.

 

10.1. Требования, предъявляемые к исходной информации

Исследование динамики показателей таможенной статистики и построение прогнозов их развития – необходимое условие выработки своевременных управленческих решений. Например, не зная динамики объемов важнейших грузов, проходящих через конкретную таможню, сезонных и конъюнктурных колебаний этих потоков, невозможно определить оптимальную численность ее сотрудников и необходимое техническое оснащение. Информационной базой для анализа динамики и прогнозирования служат временные (динамические) ряды.

Динамический ряд – это ряд значений меняющегося во времени показателя, расположенных в хронологическом порядке.

Составные элементы ряда динамики:

1) период времени (традиционно обозначается переменной t);

2) показатель уровня ряда в соответствующий период времени t (yt).

Классификация рядов динамикивозможна по различным признакам:

1) по способу выражения уровней ряда – ряды абсолютных, относительных и средних величин;

2) по способу задания периода времени – моментные и интервальные ряды;

3) по расстоянию между уровнями – ряды с равноотстоящими и неравноотстоящими уровнями во времени.

В зависимости от поставленных исследователем целей приходится решать и различные задачи анализа рядов динамики :

1) анализ и моделирование тенденций с использованием «кривых роста»;

2) анализ и моделирование взаимосвязи между последовательными уровнями ряда с использованием адаптивных моделей;

3) анализ и моделирование причинных взаимосвязей между исследуемым показателем и факторами, влияющими на него, с использованием дисперсионного и корреляционно-регрессионного методов.

Для успешного анализа рядов динамики необходимо выполнение определенных условий.

Требования, предъявляемые к исходным временным рядам:

–   сопоставимость последовательных уровней ряда (они должны быть выражены в одних и тех же единицах измерения, рассчитываться для одинаковых периодов времени, по одной и той же методике, охватывать одни и те же элементы);

–   полнота исходного ряда (достаточность числа наблюдений и отсутствие пробелов между уровнями); для успешного исследования динамики необходимы как минимум семь последовательных уровней ряда; при прогнозировании количество уровней ряда должно превышать период упреждения прогноза не менее, чем в три раза; в случае исследования сезонных процессов используемый временной ряд должен содержать квартальные либо месячные наблюдения не менее, чем за три года;[26]

–   однородность ряда (отсутствие нетипичных, аномальных значений и изломов тенденции);

–   устойчивость ряда (преобладание закономерности над случайностью в изменении уровней ряда).

Несопоставимость статистических данных может быть устранена с помощью специального приема – смыкания рядов динамики, суть которого в следующем:

1) в обоих рядах отыскивается показатель, относящийся к одному и тому же периоду времени, который рассчитан на разных базах;

2) определяется коэффициент пересчета, получаемый делением соответствующего показателя одного ряда на показатель второго ряда;

3) показатели второго ряда умножаем на полученный коэффициент.

Рассмотрим смыкание динамических рядов на следующем примере.

Пример 1.

Имеются данные об импорте в зоне деятельности таможни в период 1997–1999 гг. (таблица 10.1). В 2000 году изменилась методика расчета импорта, был сделан пересчет импорта за 1999 год по новой методике (таблица 10.2). Обеспечим сопоставимость данных путем смыкания рядов динамики :

1) рассчитываем коэффициент пересчета на основе данных за 1999 г., рассчитанных на разных базах : К=142,4/165,3≈0,861 ;

2) делаем расчет данных за 2000-2001 годы, умножая исходные данные таблицы 10.2 на коэффициент пересчета ; получаем сопоставимые данные по импорту за 1997–2001 гг. (таблица 10.3).

 

10.2. Простейшие способы анализа рядов динамики

Один из простейших способов анализа – расчет среднего уровня ряда. Методы расчета среднего уровня интервальных и моментных рядов динамики различны. Для интервальных рядов (когда время задано интервалом – декада, месяц, квартал, год и т.д.) расчет ведется по формуле средней арифметической:

 

простой – для равноотстоящих

где n – число уровней ряда;

 

взвешенной – для неравноотстоящих

где ti – длительность интервала времени между уровнями ряда.

Для моментных рядов (когда время задано выражениями типа «на 15-ое число месяца», «на начало года», «на конец квартала», и т.д.) расчет ведется по формуле средней хронологической:

 

простой – для равноотстоящих

где n – число уровней ряда;

 

взвешенной – для неравноотстоящих

где ti – длительность интервала времени между уровнями ряда.

Прочие показатели анализа динамических рядов можно исчислить двумя методами. Если в качестве базы сравнения принимается какой-то постоянный уровень ряда (обычно начальный), то мы имеем дело с базисным методом расчета показателей, а если каждый последующий уровень сравнивается с предыдущим, то метод расчета называется цепным.

Для динамического ряда y1, y2, y3,…, yn обычно рассчитываются следующие показатели:

 

–   абсолютный прирост, который характеризует скорость роста анализируемого показателя в именованных единицах,

 

где yk – базисный показатель сравнения;

–   коэффициент роста, который показывает, во сколько раз данный уровень ряда больше базисного уровня (если коэффициент больше 1) или какую часть базисного уровня составляет уровень текущего периода (если

 

коэффициент меньше 1),

 

 

–   темп роста, который как и коэффициент роста выражает интенсивность изменения уровней ряда, но в других единицах – в процентах ,

 

–   коэффициент прироста, который характеризует размер увеличения или уменьшения уровня ряда в относительных единицах (долях базисного уровня),

 

 

–   темп прироста, который характеризует размер увеличения или уменьшения уровня ряда за определенный промежуток времени – в процентах ,

 

 

–   абсолютное значение одного процента прироста, которое характеризует эластичность исследуемого явления (как изменится показатель при его увеличении или уменьшении на 1%),

 

–   темп наращивания, который дает возможность оценить изменение последовательных уровней ряда в отношении к базисному уровню,

При расчете показателей цепным методом за базисный показатель сравнения берется предыдущий уровень ряда, т.е. yk=yi-1 ; при расчете базисным методом обычно берется начальный уровень ряда, т.е. yk=y1.

Кроме показателей, перечисленных выше, рассчитываются обобщающие характеристики: средний абсолютный прирост и средний коэффициент роста.

Средний абсолютный прирост рассчитывается по формуле

 

и показывает, на сколько в среднем за единицу времени должен увеличиваться или уменьшаться уровень ряда в абсолютном выражении, чтобы, отправляясь от начального уровня, за данное число периодов достигнуть конечного уровня.

 

Средний коэффициент роста рассчитывается по формуле

и показывает, во сколько раз в среднем за единицу времени должен увеличиваться или уменьшаться уровень ряда, чтобы, отправляясь от начального уровня, за данное число периодов достигнуть конечного уровня.

С помощью средних показателей анализа динамики можно прогнозировать данные:


–   на базе среднего абсолютного прироста используется линейная модель

 

 

–   на базе среднего коэффициента роста используется степенная модель

где t – количество периодов упреждения прогноза.

Прогнозные значения, полученные на базе средних показателей, можно использовать для экспресс-прогноза, но этот метод дает не самый лучший результат.

 

10.3. Метод аналитического выравнивания

Сделать экономический прогноз с большей степенью достоверности позволяет выявление основной тенденции развития (тренда) и построение моделей взаимосвязи.

Развитие предстает зависимым только от течения времени. В итоге выравнивания временного ряда получают наиболее общий, суммарный, проявляющийся во времени результат действия всех причинных факторов. Отклонение конкретных уровней ряда от уровней, соответствующих общей тенденции, объясняют действием факторов, проявляющихся случайно или
циклически. В результате приходят к трендовой модели

где

f (t) – уровень, определяемый тенденцией развития;

ε t – случайное и циклическое отклонение от тенденции.[27]

Суть метода аналитического выравнивания заключается в подборе подходящего уравнения модели. При оценке параметров используемых моделей во всех случаях руководствуются принципом максимального приближения модели к исходным данным.

Построение прогноза по модели носит формальный характер: в уравнение подставляется соответствующее значение переменной t, а затем на основе величины случайных ошибок определяются с заданной точностью возможные отклонения от модели за счет случайных факторов.

Для достаточно устойчивых динамических рядов моделирование можно осуществлять с помощью «кривых роста».

«Кривые роста» – это математические функции, предназначенные для аналитического выравнивания временного ряда, не противоречащие характеру его развития в периоде наблюдения и в периоде упреждения прогноза.

В качестве моделей наиболее часто используются такие функции, как:

–   линейная                            y=a+b·x          ;    ( 10.17 )

–   парабола                           y=a+b·x+c·x2  ;    ( 10.18 )

–   экспонента                         y=a·bx              ;    ( 10.19 )

–   линейно-логарифмическая y=a+b·ln(x)      .    ( 10.20 )

 

Параметры моделей подбираются так, чтобы график «кривой роста» располагался на минимальном удалении от точек исходных данных, при этом наилучший результат дает метод наименьших квадратов. Математически егоможно записать следующим образом:

Согласно этому методу при оценке параметров модели всем наблюдениям присваиваются равные веса, то есть их информационная ценность признается равной, а тенденция развития на всем участке наблюдения – неизменной.

Подставив в формулу критерия наименьших квадратов аналитическое выражение для конкретной функции и приравняв к нулю частные производные по параметрам, получим систему нормальных уравнений, позволяющую оценить параметры модели.


Например, для прямой y=a+b·t получаем следующую систему из двух уравнений с двумя неизвестными:

 

Для других функций системы нормальных уравнений будут иметь другой вид.

Решая полученную систему любым известным методом, несложно вычислить параметры функции. Вычисления можно производить с использованием табличных редакторов, например, Microsoft Excel.

Подставив в полученную модель значения, находящиеся за пределами периода наблюдения, то есть в периоде упреждения прогноза, можно получить точечный (не учитывающий случайных отклонений) прогноз показателя.

Качество полученной модели определяется ее адекватностью и точностью.

 

10.4. Оценка качества модели

Адекватность и точность модели определяются на основе анализа ряда остатков et (отклонений расчетных значений от фактических):

где

yt – фактическое значение уровня;

ўt – расчетное значение уровня.

Адекватность является более важной составляющей качества, чем точность. Модель считается адекватной, если ряд ее остатков удовлетворяет требованиям нулевого среднего, случайности, независимости и нормальности последовательных остатков.

 

Критерий нулевого среднего. Рассчитывается среднее значение ряда остатков:

Если оно близко к нулю, то считается, что модель не содержит постоянной систематической ошибки и адекватна по критерию нулевого среднего, в противном случае модель неадекватна по данному критерию.

В затруднительных случаях для определения степени близости к нулю используется t-критерий Стьюдента.

Проверка случайности ряда остатков осуществляется по методу серий.

Серия – это последовательность расположенных подряд значений ряда остатков, для которых разность et-Me имеет один и тот же знак (здесь Ме – медиана ряда остатков).

 

Если модель хорошая, то она часто пересекает линию графика исходных данных и тогда серий много, а их длина невелика. В противном случае – серий мало. Для использования этого критерия вычисляются медиана Ме ряда остатков и ряд разностей et-Me, подсчитывается число серий N и длина максимальной из них L. Полученные значения сравниваются с критическими:

 

 

Если выполняется система неравенств:

 

то модель признается адекватной по критерию случайности ряда остатков. Если хотя бы одно из неравенств нарушено, то модель признается неадекватной по данному критерию.

Проверка независимости последовательных остатков является важнейшим критерием адекватности модели.

Если вид функции, описывающей систематическую составляющую f(t) , выбран неудачно, то последовательные значения ряда остатков могут не обладать свойствами независимости, ибо они могут быть взаимосвязаны между собой. В этом случае имеет место автокорреляция остатков. Существует несколько приемов обнаружения автокорреляции. Наиболее распространенным является метод, предложенный Дарбином и Уотсоном.[28]

 

Расчет коэффициента Дарбина-Уотсона осуществляется по формуле:

 

Можно показать, что величина D приближенно равна:

где

r – коэффициент автокорреляции.

Из формулы (10.28) видно, что для рядов с тесной взаимосвязью между последовательными уровнями ряда (r≈1 или r≈–1 ) значение D близко к нулю или к четырем, что свидетельствует о том, что закономерная составляющая не полностью отражена в модели и частично закономерность присуща ряду остатков, то есть модель неадекватна исходному процессу. Если последовательные остатки независимы (r≈0), то D близко к 2, что свидетельствует о хорошем качестве модели.

Для этого критерия найдены критические границы, позволяющие принять или отвергнуть гипотезу об отсутствии автокорреляции. Фрагмент критических значений критерия Дарбина – Уотсона при 5%-м уровне значимости приведен в таблице 10.4.

В этой таблице D1 и D2 – соответственно нижняя и верхняя доверительные границы критерия Дарбина – Уотсона; K – число переменных в модели; n – длина временного ряда.

Применение на практике критерия Дарбина – Уотсона основано на сравнении величины D, рассчитанной по формуле (10.27) с теоретическими значениями D1 и D2 , взятыми из таблицы 10.4.

При сравнении величины D с D1 и D2 возможны следующие варианты:

1.  Если D < D1 , то гипотеза о независимости случайных отклонений (гипотеза об отсутствии автокорреляции) отвергается.

2.  Если D > D2 , то гипотеза о независимости случайных отклонений принимается.

3.  Если D1 ≤ D ≤ D2 , то для принятия решений нет достаточных оснований, т.к. величина попадает в область неопределенности.

Рассмотренные варианты относятся к случаю, когда в остатках имеется положительная автокорреляция. Если расчетное значение D превышает 2, то с критическими значениями сравнивается вспомогательная величина 4 – D, т.е. идет проверка наличия отрицательной автокорреляции.

Нормальность ряда остатков проверяется для использования этого свойства в дальнейшем при построении доверительных интервалов. Ввиду малого числа наблюдений (менее 30) в большинстве динамических рядов это свойство может быть исследовано лишь приближенным методом – посредством вычисления коэффициентов асимметрии As и эксцесса Ex для ряда ошибок.

 

Коэффициент асимметрии As является мерой «скошенности» распределения и определяется по формуле:

 

Здесь σ – средняя квадратическая ошибка, определяемая как

Для симметричных распределений As=0; при правосторонней скошенности (когда вершина гистограммы сдвинута к минимальным значениям) As>0; для левосторонней – As<0.

 

Коэффициент эксцесса Ex является мерой «крутости» распределения:

 

Коэффициент эксцесса равен нулю для умеренно крутых (нормальных) распределений, гистограмма которых по форме напоминает колокол. Для более крутых распределений Ex>0; для сглаженных, плосковершинных распределений Ex<0. Использование в статистическом исследовании рядов с эксцессом значительно меньшим, чем (–1), делает результаты анализа ненадежными.

Требование нормальности, предъявляемое к рядам ошибок, является важнейшим условием определения границ доверительных интервалов моделей и прогнозов. О близости распределения к нормальному можно судить по виду гистограммы и по статистическим характеристикам ряда. В случае необходимости более строгой проверки используют специальные статистические критерии, однако при числе наблюдений n<30 критерии оказываются недостаточно эффективными. Поэтому обычно ограничиваются приближенной проверкой: рассчитывают коэффициенты асимметрии и эксцесса; если |As|<1 и |Ex|<1, то считается, что распределение не противоречит нормальному.[29]

Для характеристики точности построенной модели используются: максимальная ошибка, средняя абсолютная ошибка, остаточная дисперсия и средняя квадратическая ошибка.

Максимальная ошибка е maxсоответствует максимальному отклонению расчетных значений от фактических.

 

Средняя абсолютная ошибка:



Остаточная дисперсия:

 


Средняя квадратическая ошибка:

 

Среднеквадратическая ошибка – наиболее часто используемая характеристика точности, но и другие характеристики точности несут аналогичную смысловую нагрузку: чем меньше значение любой из них, тем точнее модель. Точность модели считается удовлетворительной, если σе и еabs не превышают 5–10% от среднего значения уровня ряда.

Прогнозирование по «кривым роста» – наиболее распространенный метод, который достаточно эффективен для устойчивого процесса с неизменной тенденцией на всем периоде наблюдений.

При таком подходе к прогнозированию предполагается, что размер уровня, характеризующего явление, формируется под воздействием множества факторов и не представляется возможным выделить отдельно их влияние.

Подставляя в полученное уравнение Y = f(t) значение параметра t, находящегося за пределами периода наблюдений, можно получить точечное значение прогноза. При этом точное совпадение фактических данных и прогностических точечных оценок маловероятно по следующим причинам:

1) кривая, выбранная для прогнозирования, не является единственно возможной; всегда можно подобрать кривую, которая дает более точные результаты;

2) прогноз осуществляется на основе ограниченного числа исходных данных, притом каждый исходный уровень обладает еще и случайной компонентой, следовательно, и полученная кривая будет содержать случайную компоненту;

3) тенденция характеризует движение среднего уровня динамического ряда, поэтому отдельные наблюдения будут отклоняться от полученной кривой.

При окончательном выборе модели динамического ряда следует учитывать качество модели с формальной точки зрения (адекватность и точность), цель исследования, характер динамики, неформальные предположения о дальнейшем развитии исследуемого явления.

Чтобы учесть в прогнозе влияние случайности, помимо точечного строится также интервальный прогноз. В нем отклонение от закономерности в результате случайных воздействий определяется границами доверительных интервалов. Доверительным интервалом называется интервал, в который с заданной степенью вероятности попадут истинные значения показателя при условии, что закономерности, отраженные в модели, не противоречат развитию как в периоде наблюдения, так и в периоде упреждения прогноза.

 

Исходя из предпосылки нормального распределения отклонений расчетных значений от истинных (при n>30) или распределения Стьюдента (при n<30), границы доверительных интервалов определяются по формуле:

где

yt – расчетное значение, полученное по модели для заданного значения t;

Zn,p – табличное значение t-статистики Стьюдента при заданном уровне вероятности p и числе наблюдений n;

σyt – общая среднеквадратическая ошибка прогнозирования.

 

На практике общая среднеквадратическая ошибка прогнозирования рассчитывается по формуле:[30]

где

n – длина временного ряда;

k – число оцениваемых параметров модели;

yt – фактическое значение уровня;

ўt – расчетное значение уровня.

В приближенных расчетах можно принять :

при р=0,7       Zn,p=1;

при р=0,95     Zn,p=2;

при р=0,998             Zn,p=3.

Таким образом, для «кривых роста» доверительные интервалы тем шире, чем:

–   больше остаточная дисперсия (менее точна модель);

–   меньше число наблюдений;

–   больше период упреждения прогноза;

–   сложнее форма модели;

–   больше заданная доверительная вероятность.[31]

Рассмотрим анализ с использованием «кривых роста» на следующем примере.

Пример 2 .

Имеются данные о внешнеторговом обороте (ВТО) в зоне деятельности Владивостокской таможни в период 1998-2001 гг. (таблица 10.5). Требуется проанализировать динамику ВТО и сделать прогноз стоимостного объема ВТО на 1-ое полугодие 2002 года.

Проверим исходный ряд на соответствие требованиям сопоставимости, полноты, однородности и устойчивости.

Уровни ряда выражены в одних и тех же единицах измерения – млн. долларов США ; рассчитаны для одинаковых интервалов времени – по полугодиям, по одной и той же методике – в соответствии с Методологией таможенной статистики внешней торговли Российской Федерации. Но требование сопоставимости последовательных уровней ряда в данном случае не выполняется, поскольку со 2-го полугодия 2001 года зона ответственности Владивостокской таможни была расширена за счет присоединения Артемовской таможни, преобразованной в таможенный пост.

ВТО в зоне Артемовского таможенного поста во 2-ом полугодии 2001 года составил 444,0 млн. долларов. Вычитая этот показатель из соответствующего уровня исходного ряда получаем новые данные для анализа (таблица 10.6).

В таблице 10.6 представлен ряд, отвечающий требованию сопоставимости последовательных уровней ряда. Проверим, отвечает ли он остальным трем требованиям.

Полученный ряд динамики содержит 8 последовательных уровней ряда, пропущенных значений нет, при этом период упреждения прогноза составляет одно полугодие (на 1 уровень вперед), следовательно, требование полноты исходного временного ряда выполнено.

Изобразим графически ряд, представленный в таблице 10.6 (рисунок 10.1) . На графике видно, что аномальные значения и изломы в рассматриваемом динамическом ряду отсутствуют. Следовательно, данный ряд соответствует требованию однородности.

Точки графика группируются в определенном направлении, то есть закономерность преобладает над случайностью. Следовательно, данный ряд отвечает требованию устойчивости.

Сглаживая линию построенного графика, выдвигаем гипотезу : основная тенденция развития ВТО может быть описана уравнением параболы (10.18) :

y=a0+a1·t+a2·t2 .

Для оценки параметров этого уравнения воспользуемся методом наименьших квадратов. Тогда система нормальных уравнений имеет вид :[32]


Расчет параметров модели выполним с помощью табличного редактора Microsoft Excel (таблица 10.7) . Согласно расчетам, проведенным в 1 части таблицы, получена система нормальных уравнений :

 

 

Можно представить эту систему в матричной форме

 

Следовательно, рассчитав матрицу А-1 , обратную матрице А, легко вычислить вектор Х, коэффициентами которого являются параметры искомого уравнения :

Все необходимые операции с матрицами произведены в части 2 таблицы 10.7. Получены следующие параметры : a0=370,32 , a1=–83,263 , a2=8,2137 . Следовательно, уравнение параболы имеет вид :

y=370,32–83,263·t+8,2137·t2 .

Для проверки адекватности построенной модели проведем анализ ряда остатков (таблица 10.8).

Проведенные расчеты показывают, что :

 

1) в данном случае выполняется свойство нулевого остатка, поскольку

то есть модель адекватна по критерию нулевого среднего ;

2) проверяя случайность ряда остатков, имеем число серий N =5, длина максимальной из них L =3. Рассчитывая критические значения, получаем N кр =[6, 2799]=6 , L кр = [1,907]=2 . Соотношения

N>N кр , L<L кр

не выполнены, значит, модель не адекватна по критерию случайности ;

3) рассчитаем коэффициент Дарбина-Уотсона : D =2,471 . В данном случае значение коэффициента больше 2. Следовательно, следует рассмотреть величину 4– D = 1,529 . Критическое значение коэффициента Дарбина-Уотсона в данном случае составляет D2=1,36. Поскольку D>D2 , модель адекватна по критерию независимости последовательных остатков ;

4) средняя квадратическая ошибка составляет σ=14,254 , тогда коэффициент асимметрии As=0,066 , коэффициент эксцесса Ex =-0,148. При этом выполняются соотношения | As|=0,066<1, | Ex|<1. Значит, модель адекватна по критерию нормальности.

Вывод : по совокупности 3-х критериев (нулевого среднего, независимости и нормальности ряда остатков) выбранная нами модель адекватна исходным данным и может быть использована для анализа и прогнозирования.

Оценим точность выбранной модели :

1) средняя абсолютная ошибка eabs =87,8/8=10,98 ;

2) средняя квадратическая ошибка σe=14,25.


Среднее значение уровня анализируемого ряда составляет y ср =1640,7/8=205,09 млн. долларов США, тогда соотношение средней абсолютной ошибки eabs и средней квадратической ошибки σe к среднему значению уровня ряда y ср составит :

Следовательно, точность выбранной модели составляет 7%, что вполне удовлетворительно.

Расчеты показали, что уравнение параболы y=370,32–83,263·t+8,2137·t2 достаточно адекватно и точно отражает динамику внешнеторгового оборота в зоне ответственности Владивостокской таможни в период 1998-2001 гг. Воспользуемся этим уравнением для анализа и прогнозирования.

На рисунке 10.1 видно, что в начале анализируемого периода наблюдалось снижение анализируемого показателя, достигшее своего минимального уровня в 1-ом полугодии 2000 г. (151,2 млн. долларов США). Причина снижения ВТО была связана, в первую очередь, с финансовым кризисом в августе 1998 года. Снижение платежеспособности населения привело к значительному сокращению стоимостного объема ВТО. Однако процесс стабилизации национальной экономики, начавшийся в 2000 году, определил постепенный рост ВТО, начиная со 2-го полугодия 2000 г. и до конца анализируемого периода.

Таким образом, основная тенденция развития исследуемого явления показывает, что если факторы, оказывающие влияние на внешнюю торговлю, кардинально не изменятся, то в 1-ом полугодии 2002 года (при t =9) без учета показателей Артемовского таможенного поста ВТО должен составить y9=370,32-83,263·9+8,2137·92=286,3 млн. долларов США.

 

Определим доверительный интервал нашего прогноза. Имеем n =8, k =3, тогда по формуле (10.28) получаем :

Возьмем уровень значимости p =0,95, тогда Zn,p=2 и по формуле (10.27) имеем : Yt =286,3±2∙18,0=286,3±36,0 млн. долларов США.

Таким образом, с вероятностью 95% прогнозное значение ВТО на 1-ое полугодие 2002 г. попадет в интервал :

250,3 < Yt < 322,3 .

Как показала практика, в 1-ом полугодии 2002 г. ВТО фактически составил 241,4 млн. долларов (без учета показателей Артемовского таможенного поста). Существенное отличие прогнозного значения показателя от фактического вполне объяснимо, поскольку экономические и политические факторы, влияющие на динамику ВТО, не являются постоянными и неизменными величинами.

 

10.5. Анализ сезонных колебаний

Если в анализируемой временной последовательности наблюдаются устойчивые отклонения от тенденции как в большую, так и в меньшую сторону, то можно предположить наличие в ряду динамики одного или нескольких колебательных процессов. Это явление особенно заметно при изучении сезонных процессов (экспорт рыбы и древесины, импорт овощей и фруктов и т.д.). Периодичность этих процессов может быть различной (квартал, год и пр.).

Достаточно часто наличие сезонных колебаний выявляется с помощью графического метода. В этом случае применяют линейные диаграммы, на которые наносят данные по месяцам (кварталам).

Иногда бывает целесообразно для выявления сезонных колебаний использовать среднесуточные уровни за каждый месяц, что позволяет исключить влияние различной продолжительности месяцев. Эти уровни исчисляются путем деления общего объема явления за месяц на число календарных дней в месяце.[33]

 

В общем виде для анализа колебательных процессов и оценки их значимости временной ряд представляют как совокупность гармонических колебательных процессов. Для каждой точки этого ряда справедливо выражение[34]

 

Здесь Yt – фактический уровень ряда в момент времени t; f(t) – выровненный уровень ряда в момент t; an и bn – параметры колебательного процесса (гармоники ряда Фурье), оценивающие соответственно размах (амплитуду) отклонения от общей тенденции и сдвиг колебаний относительно начальной точки.

При анализе процессов, которым в явном виде присущи сезонные особенности, имеет смысл ограничиться более простой процедурой – исчислением индексов сезонности. Индексы сезонности показывают, во сколько раз фактический уровень ряда в момент времени t больше среднего уровня или уровня, получаемого по уравнению тенденции Y = f(t).

При анализе сезонности уровни временного ряда показывают развитие явления по месяцам или кварталам как минимум в течение трех лет. Для каждого месяца (квартала) получают обобщенный индекс сезонности как среднюю арифметическую из одноименных индексов каждого года. При этом возможны два варианта.[35]

 

1.  Тренда нет или он незначителен. В этом случае для каждого месяца (квартала) соответствующего года имеем свой индекс сезонности:

где

Yt – уровень показателя за месяц (квартал) t;

Yср – общий средний уровень показателя.

 

Затем рассчитываем средний индекс сезонности:

где

T – число лет.

2.  При наличии тренда порядок расчета следующий:

1) для каждого уровня определяют выровненные значения по тренду f(t);

 

2) рассчитывают отношения

3) по формуле (10.40) находят среднее из этих отношений для одноименных месяцев (кварталов).

И в первом, и во втором случае на основе полученных средних значений индексов сезонности строится график (сезонная волна).

При анализе динамики и прогнозировании наличие сезонности обязательно должно быть учтено.

Грамотно проведенный исследователем статистический анализ динамики позволяет:

1) моделировать основные тенденции развития явлений и процессов с использованием «кривых роста»;

2) выделять сезонную компоненту в процессе анализа;

3) осуществлять экономические прогнозы.

Применение рассмотренных в этой главе методов анализа динамики возможно не только в сфере таможенной статистики внешней торговли, но и на базе данных специальной таможенной статистики.

 

Резюме

Исследование динамики статистических показателей и построение прогнозов их развития – важнейшая из задач, решаемых таможенной статистикой. Информационной базой в этом случае являются динамические ряды.

Динамический ряд – это ряд значений меняющегося во времени показателя, расположенных в хронологическом порядке. Всякий динамический ряд имеет составные элементы: период времени (t) и показатель уровня ряда (yt).

Классификация рядов динамикивозможна по различным признакам: п о способу выражения уровней ряда – ряды абсолютных, относительных и средних величин; по способу задания периода времени – моментные и интервальные ряды; по расстоянию между уровнями – ряды с равноотстоящими и неравноотстоящими уровнями во времени.

Для успешного анализа рядов динамики необходимо выполнение определенных требований: сопоставимость последовательных уровней ряда, полнота, однородность и устойчивость исходного ряда. Несопоставимость статистических данных может быть устранена с помощью специального приема – смыкания рядов динамики.

Существуют простейшие приемы и способы анализа динамических рядов. Один из них – расчет среднего уровня ряда. Методы расчета среднего уровня интервальных и моментных рядов динамики различны.

Для интервальных рядов (когда время задано интервалом – декада, месяц, квартал, год и т.д.) расчет ведется по формуле средней арифметическойпростой (для равноотстоящих рядов) и взвешенной (для неравноотстоящих).

Для моментных рядов (когда время задано выражениями вида «на 10-ое число месяца», «на начало года», «на конец квартала», и т.д.) расчет ведется по формуле средней хронологическойпростой (для равноотстоящих рядов) и взвешенной (для неравноотстоящих).

Прочие простейшие показатели анализа динамических рядов можно рассчитать двумя методами. Если в качестве базы сравнения принимается какой-то постоянный уровень ряда (обычно начальный), то мы имеем дело с базисным методом расчета показателей, а если каждый последующий уровень сравнивается с предыдущим, то метод расчета называется цепным.

В анализе временных рядов используются показатели: абсолютный прирост, коэффициент роста, темп роста, коэффициент прироста, темп прироста, абсолютное значение одного процента прироста, темп наращивания.

Кроме показателей, перечисленных выше, рассчитываются обобщающие характеристики: средний абсолютный прирост и средний коэффициент роста.

С помощью средних показателей анализа динамики можно прогнозировать данные: по линейной модели – на базе среднего абсолютного прироста; по степенной модели – с помощью среднего коэффициента роста. Но использовать эти прогнозные значения можно только для экспресс-прогноза. Сделать экономический прогноз с большей степенью достоверности позволяет выявление основной тенденции развития и построение моделей взаимосвязи с использованием метода аналитического выравнивания.

Для достаточно устойчивых динамических рядов моделирование можно осуществлять с помощью «кривых роста». «Кривые роста» – это математические функции, предназначенные для аналитического выравнивания временного ряда, не противоречащие характеру его развития в периоде наблюдения и в периоде упреждения прогноза. В качестве моделей наиболее часто используются такие функции, как: линейная, парабола, степенная, линейно-логарифмическая и пр.

Качество полученной модели определяется ее адекватностью и точностью. Адекватность и точность модели определяются на основе анализа ряда остатков et (отклонений расчетных значений от фактических).

Адекватность является более важной составляющей качества, чем точность. Модель считается адекватной, если ряд ее остатков удовлетворяет требованиям нулевого среднего, случайности, независимости и нормальности последовательных остатков.

В критерии нулевого среднего рассчитывается среднее значение ряда остатков. Если оно близко к нулю, то считается, что модель не содержит постоянной систематической ошибки и адекватна по критерию нулевого среднего. В затруднительных случаях для определения степени близости к нулю используется t-критерий Стьюдента.

Проверка случайности ряда остатков осуществляется по методу серий.

Серия – это последовательность расположенных подряд значений ряда остатков, для которых разность et-Me имеет один и тот же знак (здесь Ме – медиана ряда остатков). Для использования этого критерия вычисляются медиана Ме ряда остатков и ряд разностей et-Me, подсчитывается число серий N и длина максимальной из них L. Полученные значения сравниваются с критическими и оценивается адекватность модели.

Проверка независимости последовательных остатков является важнейшим критерием адекватности модели.

Если вид функции f(t) выбран неудачно, то последовательные значения ряда остатков могут быть взаимосвязаны между собой. В этом случае говорят, что имеет место автокорреляция остатков. Существует несколько приемов обнаружения автокорреляции. Наиболее распространенным является метод, предложенный Дарбином и Уотсоном.

Нормальность ряда остатков проверяется для использования этого свойства в дальнейшем при построении доверительных интервалов. Ввиду малого числа наблюдений (менее 30) в большинстве динамических рядов это свойство может быть исследовано лишь приближенным методом – посредством вычисления коэффициентов асимметрии As и эксцесса Ex для ряда ошибок.

Для характеристики точности построенной модели используются такие характеристики, как: максимальная ошибка, средняя абсолютная ошибка, остаточная дисперсия и средняя квадратическая ошибка.

Прогнозирование по «кривым роста» – наиболее распространенный метод, который достаточно эффективен для устойчивого процесса с неизменной тенденцией на всем периоде наблюдений. Подставляя в полученное уравнение Y = f(t) значение параметра t, находящегося за пределами периода наблюдений, можно получить точечное значение прогноза. При этом точное совпадение фактических данных и прогностических точечных оценок маловероятно.

Для того, чтобы учесть в прогнозе влияние случайности, помимо точечного строится также интервальный прогноз. Доверительным интервалом называется интервал, в который с заданной степенью вероятности попадут истинные значения показателя при условии, что закономерности, отраженные в модели, не противоречат развитию как в периоде наблюдения, так и в периоде упреждения прогноза.

При окончательном выборе модели динамического ряда следует учитывать качество модели с формальной точки зрения (адекватность и точность), цель исследования, характер динамики, неформальные предположения о дальнейшем развитии исследуемого явления.

Для изучения сезонных процессов используются модели сезонных колебаний с использованием гармоник ряда Фурье, а также индексы сезонности. При анализе динамики и прогнозировании наличие сезонности обязательно должно быть учтено.

 

Вопросы для контроля

1.  Что такое «динамический ряд»? Приведите примеры таких рядов.

2.  Назовите требования, предъявляемые к исходным рядам динамики.

3.  Какие виды средних преобладают в анализе динамических рядов?

4.  Как взаимосвязаны простейшие динамические характеристики?

5.  Назовите средние показатели анализа динамики. Как они рассчитываются, в какой сфере находят свое применение?

6.  Что представляют собой «кривые роста»? Назовите функции, используемые при моделировании.

7.  Охарактеризуйте понятия «адекватность» и «точность» модели.

8.  Что общего между точечным прогнозом и доверительным интервалом?

9.  Что представляет собой «сезонная волна»?

 

Тесты

1.  По способу задания периода времени ряды классифицируются как:

а) моментные,

б) равноотстоящие,

в) интервальные,

г) квартальные,

д) неравноотстоящие.

 

2.  Требования, предъявляемые к анализируемым рядам динамики:

а) однородность,

б) аддитивность,

в) полнота,

г) устойчивость,

д) доверительность.

 

3.  Несопоставимость статистических данных может быть устранена путем:

а) расчета средних показателей анализа динамики,

б) исчисления индексов сезонности,

в) выбора подходящей математической модели,

г) смыкания рядов динамики,

д) расчета среднего уровня ряда.

 

4.  Средний уровень моментного ряда может рассчитываться как:

а) мода,

б) средняя арифметическая простая,

в) медиана,

г) средняя арифметическая взвешенная,

д) средняя хронологическая простая.

 

5.  Темп роста характеризует собой:

а) размер увеличения или уменьшения уровня ряда за определенный промежуток времени – в процентах,

б) во сколько раз данный уровень ряда больше базисного уровня,

в) интенсивность изменения уровней ряда в процентах,

г) скорость роста анализируемого показателя в именованных единицах,

д) размер увеличения или уменьшения уровня ряда в долях базисного уровня.

 

6.  Стоимостный объем импорта: в 1999 г. – 216 млн. долларов США, в 2003 г. – 397 млн. долларов. Тогда среднегодовой темп прироста равен:

а) 1,164 ,

б) 116,4% ,

в) 0,164,

г) 45,25 млн. долларов,

д) 16,4% .

 

7.  Оценка параметров «кривых роста» производится методом:

а) базисным,

б) Дарбина – Уотсона,

в) цепным,

г) наименьших квадратов,

д) гармоник ряда Фурье.

 

8.  Адекватность модели определяется при:

а) построении графика «кривой роста»,

б) вычислении и оценке коэффициента эксцесса,

в) расчете и оценке коэффициента Дарбина – Уотсона,

г) расчете и оценке средней абсолютной ошибки,

д) проверке свойства нулевого среднего,

е) вычислении и оценке коэффициента асимметрии.

 

9.  Для «кривых роста» ширина доверительных интервалов зависит от:

а) периода упреждения прогноза,

б) числа наблюдений,

в) точности аппроксимации,

г) остаточной дисперсии,

д) адекватности модели.

 


Глава 11.   Корреляционно–регрессионный анализ

 

Факторные и результативные признаки. Корреляция. Классификация корреляционных связей. Уравнение регрессии. Сущность корреляционно-регрессионного метода. Корреляционное поле. Линейный коэффициент корреляции. Коэффициент регрессии. Теоретическая линия регрессии. Средняя ошибка аппроксимации. Коэффициент детерминации. Множественная регрессия. Коэффициент множественной детерминации. Коэффициент множественной корреляции.

 

11.1. Основные понятия

Исследуя явления в самых различных областях, статистика неизбежно сталкивается с зависимостями как между количественными, так и между качественными признаками. Задача статистики – выявить такие зависимости и дать их количественную характеристику.

Каждому процессу или явлению соответствует определенный набор признаков. Факторными признаками или просто факторами называются признаки, под воздействием которых изменяются другие, связанные с ними признаки. Признаки, изменяющиеся под воздействием факторных признаков, называются результативными.

Одна из основных задач статистики – исследование взаимосвязи наблюдаемых процессов и явлений. Можно выделить две формы проявления взаимосвязи:

1) полная (функциональная), когда каждому значению факторного признака соответствует одно и только одно значение результативного признака, определяемое по какой-либо формуле;

2) неполная (стохастическая или статистическая), когда причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений.

Частным случаем стохастической связи является корреляционная зависимость.

Корреляция – это зависимость среднего значения исследуемого показателя от учитываемых факторов, не имеющая строго функционального характера.

Классификация корреляционных связей может быть различной в зависимости от признака, положенного в ее основу.

Корреляционные связи различаются:

–   по направлению: 1) прямые (положительные), когда зависимая переменная растет с увеличением факторного признака; 2) обратные (отрицательные), при которых рост зависимой переменной сопровождается уменьшением факторного признака;

–   по аналитической форме: 1) линейные, когда между признаками в среднем проявляются линейные отношения; 2) нелинейные, когда взаимосвязь между признаками в среднем выражается нелинейной функцией;

–   по количеству взаимодействующих факторов: 1) парные, если характеризуется связь двух признаков; 2) множественные, если изучаются более чем две переменные;

–   по силе: 1) слабые и 2) сильные; при этом сила связи выражается конкретными величинами и интерпретируется в соответствии с общепринятыми критериями;

–   по характеру связи: 1) непосредственные; 2) косвенные, если существует третья величина, являющаяся связующим звеном между изучаемыми признаками; 3) ложные – это связи, установленные формально и подтвержденные только количественными оценками, не имеющие под собой качественной основы или вообще бессмысленные.

Если взаимосвязь между признаками установлена, то для ее описания необходимо подобрать некоторую модель (уравнение). Уравнение регрессии – аналитическое выражение, связывающее исследуемый экономический показатель и учитываемые факторы, влияющие на него.

Таким образом, сущность корреляционно-регрессионного метода выражается в решении двух задач:

1) установление степени тесноты связи (корреляционный анализ);

2) описание формы связи, то есть построение модели (регрессионный анализ).

 

11.2. Парный корреляционный анализ

Для таможенной статистики наиболее характерным является анализ статистической связи между двумя признаками – парная корреляция: y – анализируемый показатель, x – фактор, под влиянием которого изменяется y. Форма зависимости y от x может быть как линейной, так и нелинейной.

Первым шагом в проведении исследования является построение специального графика, называемого корреляционное поле или диаграмма рассеяния, где на оси абсцисс откладываются значения x, по оси ординат – y, а точки соответствуют сочетаниям первичных наблюдений x и y. По расположению точек, по их концентрации в определенном направлении можно судить о наличии связи.

На практике для количественной оценки тесноты связи широко используется линейный коэффициент корреляции, который определяется по формуле:

 

где

x – среднее значение факторного показателя;

y – среднее значение результативного показателя;

xi – наблюдаемое значение факторного показателя;

yi – наблюдаемое значение результативного показателя.

Путем несложных математических преобразований можно получить и другие модификации формулы линейного коэффициента корреляции, например:


Линейный коэффициент корреляции можно рассчитать и по формуле


где

a1 – коэффициент регрессии в уравнении связи (см. п. 11.3);

σx – среднее квадратическое отклонение в ряду x;

σy – среднее квадратическое отклонение в ряду y.

Линейный коэффициент корреляции может принимать значения от –1 до +1. Знак определяется в ходе решения. Для интерпретации значений коэффициента корреляции можно пользоваться таблицей 11.1. При этом положительный знак коэффициента свидетельствует о том, что между результатом и фактором существует прямая связь; отрицательный знак свидетельствует о наличии обратной связи.[36] Если линейный коэффициент корреляции r очень близок к нулю, то возможно нелинейное взаимодействие между x и y, что требует дополнительной проверки.

 

При небольшом числе наблюдений (n<30) средняя ошибка линейного коэффициента корреляции есть

 

Проверка значимости линейного коэффициента корреляции проводится с применением t–критерия Стьюдента: фактическое значение критерия t факт сравнивается с критическим значением t крит .

Фактическое значение t-критерия определяется по формуле:

 

где

r – линейный коэффициент корреляции;

n – объем статистической совокупности.

Критическое значение t-критерия определяется из таблицы значений t–критерия Стьюдента (таблица 11.2). При заданном уровне значимости α (обычно α=0,05) критическим будет t, соответствующее числу степеней свободы k=n –2 .

Поэтому в каждом конкретном случае по таблице 11.2 находится такое критическое значение t, которое допустимо при справедливости нулевой гипотезы о равенстве коэффициента корреляции нулю. Линейный коэффициент корреляции считается существенным или значимым, если выполняется соотношение t факт >t крит . Если t факт <t крит , то считается, что связь между x и y отсутствует.[37]

Для того, чтобы определить форму связи между x и y, применяются методы регрессионного анализа.

 

11.3. Парный регрессионный анализ

Регрессионный анализ позволяет определить вид зависимости между переменной величиной и влияющим на нее фактором в виде некоторой параметрической функции.

Решая задачу парной регрессии, предположим, что:

 

1.  Наблюдаемое значение переменной y можно представить в виде двух частей, одна из которых закономерно зависит от переменной x, другая часть – случайная величина по отношению к x, то есть

 

где

f(xi) – некоторая параметрическая функция, связывающая переменные x и y;

εi – значение некоторой случайной величины, соответствующее i–му наблюдению.

2.  Все наблюдения независимы, и случайные величины ε i имеют одинаковые законы распределения.

Если предполагается, что исследуемая связь носит линейный характер, то в качестве модели выбирается класс линейных функций y=a0+a1x .

Если считается, что связь нелинейная, то определяется соответствующая форма нелинейной зависимости, например: y=a0+a1∙x+a2∙x2 (парабола), y=a0+a1/x (гипербола) и т.д.


Затем с помощью исходных статистических данных производится оценка параметров модели регрессии. Для этого выбирается определенный метод. Наиболее эффективным методом оценивания параметров рассматриваемой модели является метод наименьших квадратов, когда оценки параметров модели находятся как результат решения оптимизационной задачи вида:

где

yi – исходные значения зависимой переменной y;

f(xi) – теоретические значения y, вычисленные по уравнению модели.

 

Например, для линейной модели y=a+a1x (которая наиболее часто используется на практике) минимизация квадратов отклонений наблюдаемых значений зависимой переменной от вычисленных по уравнению регрессии осуществляется решением системы нормальных уравнений:

 

Решив полученную систему из двух уравнений с двумя неизвестными (a и a1) любым доступным методом (например, методом Гаусса или матричным), можно вычислить расчетные значения f(xi)=a+a1∙xi , которые на графике образуют теоретическую линию регрессии.

Параметры a1 и a 2 называются коэффициентами регрессии. Они показывают, на сколько единиц (в абсолютном выражении) изменится величина результативного признака y при изменении фактора x на единицу при условии, что влияние прочих факторов будет сведено к нулю.

Проверка значимости коэффициента регрессии a 1 проводится с применением t-критерия Стьюдента: фактическое значение критерия t факт сравнивается с критическим значением t крит , определяемым для числа степеней свободы k=n-2 и заданного уровня значимости α.

Фактическое значение t-критерия для коэффициента регрессии a 1 определяется по формуле:


Критическое значение t-критерия определяется из таблицы значений t–критерия Стьюдента. При заданном уровне значимости α (обычно α=0,05) критическим будет t, соответствующее числу степеней свободы k=n –2 . Коэффициент регрессии считается существенным или значимым, если выполняется соотношение t факт > t крит .

Полученную модель нужно проверить на адекватность – соответствие имеющимся статистическим данным. На практике в качестве критерия можно использовать среднюю ошибку аппроксимации, которая определяется по формуле:


Здесь yi теор – расчетные значения переменной y, вычисленные по уравнению регрессии.

Если значение средней ошибки аппроксимации не превышает 0,15 (то есть 15%), то считается, что модель регрессии адекватно описывает реальные статистические данные.

В общем случае проверка адекватности модели осуществляется путем расчета F–критерия Фишера и сопоставления его с табличным:

 

где

r – коэффициент корреляции;

n – число наблюдений;

m – число параметров в уравнении регрессии.

Расчетное Fфакт сопоставляется с критическим (таблица 11.3), определяемым для числа степеней свободы k1=m–1 и k2=n–m и заданного уровня значимости α. Если Fфакт > Fкрит , то уравнение значимо.

Чтобы определить, в какой степени вариация переменной y объясняется уравнением регрессии, вычисляется коэффициент детерминации:


где

y – среднее значение величины y;

yi – наблюдаемые значения зависимой переменной y;

yi теор – расчетные значения y, полученные из уравнения регрессии.

Коэффициент детерминации изменяется от 0 до 1 и характеризует удельный вес (процент) общей дисперсии, который объясняется уравнением регрессии (или изменением факторного показателя x). Можно показать, что значение коэффициента детерминации равно квадрату коэффициента корреляции.[38]

Уравнение регрессии можно рассматривать в качестве модели прогнозирования, но эта модель описывает взаимосвязь переменных лишь в среднем, и прогнозные значения y не будут совпадать с фактическими.

 

11.4. Множественная регрессия


Возможны ситуации, когда нужно исследовать зависимость переменной y от нескольких факторов (x1 , x2 , …, xk ). В этом случае используется уравнение множественной линейной регрессии:

 

где a1, a2, …, ak – коэффициенты регрессии, каждый из которых показывает, на сколько единиц изменится y с изменением какого-либо из факторов xj (j=1,2,…,k) на единицу при условии, что значения остальных факторов останутся на прежнем уровне.

Применяя метод наименьших квадратов для оценки параметров множественной регрессии, приходим к решению системы нормальных уравнений с k+1 неизвестными:


 

Качество вычисленного по методу наименьших квадратов уравнения множественной регрессии зависит от того, насколько хорошо оно сглаживает данные наблюдений. Как и в случае парной регрессии, важнейшей характеристикой качества уравнения является коэффициент множественной детерминации ( R2 ), измеряющий долю полной вариации переменной y, объясняемую уравнением множественной регрессии:[39]

 

где

y – среднее значение величины y;

yi – наблюдаемые значения зависимой переменной y;

yi теор – расчетные значения y, полученные из уравнения регрессии.

Наряду с R2 во множественном корреляционно-регрессионном анализе рассматривается показатель, равный корню квадратному из коэффициента множественной детерминации:

 

Величина R называется коэффициентом множественной корреляции. Этот коэффициент отражает тесноту связи между зависимой переменной и влияющими на нее факторами. Он всегда неотрицателен и изменяется от 0 до 1. Чем ближе значение R к 1, тем большее одновременное влияние оказывают независимые переменные на величину y.

Как показывает практика построения многофакторных моделей, все реально существующие зависимости между социально-экономическими явлениями можно описать, используя пять типов моделей: линейную, степенную, показательную, параболическую и гиперболическую.

Ввиду сложности задачи, на практике поиск решения осуществляется с помощью ПЭВМ. Но все-таки основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации.

 

11.5. Возможные ошибки при практическом использовании корреляционно-регрессионного анализа

Корреляционно-регрессионный анализ – это эффективный инструмент статистического анализа, но при его использовании зачастую возникают ошибки, которые могут привести к неправильным выводам.

 

Прогнозирование вне границ изменения наблюдаемых данных

Эта ошибка возникает при использовании уравнения регрессии в качестве прогнозной функции, когда подставляемое значение независимой переменной выходит за границы изменения выборочных значений x. Следует помнить, что уравнение регрессии является экстраполяционным, то есть оно отражает зависимость, которая действует только в диапазоне изменения данных, на основе которых оно было получено.


Дата добавления: 2019-09-02; просмотров: 687; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!