Применение статистических методов к экономическим проблемам

Студенты, изучающие эконометрику, всегда ценят обзор статистических концепций, наиболее важных для достижения успеха в эконометрике. В частности, вам нужно уметь распределять вероятности, вычислять описательную статистику и проверять гипотезы.

Ваша способность точно количественно определять экономические отношения зависит не только от ваших навыков построения эконометрических моделей, но и от качества данных, которые вы используете для анализа, и от вашей способности принять соответствующие стратегии для оценки моделей, которые могут нарушать статистические предположения. , Данные должны быть получены из надежного процесса сбора, но вы также должны знать о любых дополнительных ограничениях или проблемах.

Они могут включать, но не ограничиваются

  • Агрегирование данных. Информация, которая может быть получена на уровне домохозяйства, отдельного лица или фирмы, в ваших данных измеряется на уровне города, округа, штата или страны.
  • Статистически коррелированные, но не относящиеся к экономике переменные: некоторые наборы данных содержат большое количество информации, но многие из переменных могут не иметь ничего общего с экономическим вопросом, на который вы надеетесь ответить.
  • Качественные данные. Богатые наборы данных обычно включают качественные переменные (географическая информация, раса и т. Д.), Но эта информация требует особого подхода, прежде чем вы сможете использовать ее в эконометрической модели.
  • Ошибка предположения классической линейной регрессионной модели (CLRM): легитимность вашего эконометрического подхода всегда основывается на ряде статистических предположений, но вы, вероятно, обнаружите, что хотя бы одно из этих предположений не выполняется (то есть оно не соответствует действительности) для ваших данных).

Признавая важность типа данных, частоты и агрегации

Данные, которые вы используете для оценки и тестирования вашей эконометрической модели, обычно подразделяются на один из трех возможных типов:

  • Поперечное сечение. Этот тип данных состоит из измерений для отдельных наблюдений (людей, домохозяйств, фирм, округов, штатов, стран и т. Д.) В определенный момент времени.
  • Временные ряды. Этот тип данных состоит из измерений одной или нескольких переменных (таких как валовой внутренний продукт, процентные ставки или уровень безработицы) с течением времени в данном пространстве (например, в конкретной стране или штате).
  • Панельный или продольный: этот тип данных состоит из временного ряда для каждой единицы поперечного сечения в образце. Данные содержат измерения для отдельных наблюдений (людей, домохозяйств, фирм, округов, штатов, стран и т. Д.) За определенный период времени (дни, месяцы, кварталы или годы).

В дополнение к знанию типа данных, с которыми вы работаете, убедитесь, что вы всегда знаете следующую информацию:

  • Уровень агрегирования, используемый при измерении переменных: уровень агрегации относится к единице анализа, когда информация собирается для данных. Другими словами, переменные измерения могут происходить на более низком уровне агрегирования (например, физическое лицо, домохозяйство или фирма) или на более высоком уровне агрегации (например, город, округ или штат).
  • Частота , с которой фиксируются данные: частота относится к скорости , при которой получается измерение. Данные временных рядов могут быть получены с более высокой частотой (например, ежечасно, ежедневно или еженедельно) или с более низкой частотой (например, ежемесячно, ежеквартально или ежегодно).

Как избежать ловушки данных

По мере того, как вы приобретаете больше инструментов анализа данных, вы можете склоняться к поиску в данных взаимосвязей между переменными. Вы можете использовать свои знания статистики, чтобы найти модели, которые вполне соответствуют вашим данным. Тем не менее, эта практика называется извлечением данных, и вы не хотите, чтобы ее соблазнили!

Включение количественной и качественной информации

На экономические результаты могут влиять как количественные (числовые), так и качественные (не числовые) факторы. Как правило, количественная информация имеет прямое применение и интерпретацию в эконометрических моделях.

Качественные переменные связаны с признаками, которые не имеют естественного числового представления, хотя ваши необработанные данные могут кодировать качественные характеристики с числовым значением. Например, регион РФ может быть закодирован с 1 для запада, 2 для юга, 3 для востока и 4 для севера. Однако присвоение конкретных значений является произвольным и не имеет особого значения.

Чтобы использовать информацию, содержащуюся в качественных переменных, вы обычно конвертируете их в фиктивные переменные — дихотомические переменные, которые принимают значение 1, если присутствует определенная характеристика, и 0 в противном случае.

Иногда сам экономический результат является качественным или содержит ограниченные значения. Например, ваша зависимая переменная может измерять, потерпела ли фирма неудачу (обанкротится) в данный год, используя различные характеристики фирмы в качестве независимых переменных. Хотя стандартные методы иногда приемлемы с качественными и непрерывными зависимыми переменными, обычно они приводят к нарушениям допущений и требуют альтернативного эконометрического подхода.