Шпаргалки по эконометрике для написания научной работы

Распознавание обычных переменных: нормальное распределение

В эконометрике, случайная величина с нормальным распределением имеет функцию плотности вероятности. Хотя многие случайные величины могут иметь колоколообразное распределение, функция плотности нормального распределения точно

где

представляет среднее значение нормально распределенной случайной величины X ,

стандартное отклонение, и

представляет дисперсию нормально распределенной случайной величины .

Отличительной чертой нормального распределения является вероятность (или плотность), связанная с конкретными сегментами распределения. Нормальное распределение на рисунке разделено на наиболее распространенные интервалы (или сегменты): одно, два и три стандартных отклонения от среднего значения.

При нормально распределенной случайной величине приблизительно 68 процентов измерений находятся в пределах одного стандартного отклонения от среднего, 95 процентов находятся в пределах двух стандартных отклонений, а 99,7 процента находятся в пределах трех стандартных отклонений.

Предположим, у вас есть данные для всего населения, проживающего в домах престарелых. Вы обнаружите, что средний возраст этих людей составляет 70 лет, а разница составляет 9

и распределение их возраста нормальное. Используя стенографию, вы можете просто написать эту информацию как

Если вы случайно выберете одного человека из этой группы населения, каковы шансы, что ему или ей больше 76 лет?

Используя плотность из нормального распределения, вы знаете, что примерно 95 процентов измерений находятся между 64 и 76

(обратите внимание, что 6 равно двум стандартным отклонениям). Остальные 5 процентов — это лица моложе 64 лет или старше 76 лет. Поскольку нормальное распределение является симметричным, вы можете заключить, что у вас есть шанс 2,5% (5% / 2 = 2,5%), который вы выбираете случайным образом кто-то, кому больше 76 лет.

Если случайная величина является линейной комбинацией другой нормально распределенной случайной (ых) переменной (ей), она также имеет нормальное распределение.

Предположим, у вас есть две случайные величины, описываемые этими терминами:

Другими словами, случайная величина X имеет нормальное распределение со средним

и дисперсия

и случайная величина Y имеет нормальное распределение со средним

и дисперсия

Если вы создадите новую случайную переменную W как следующую линейную комбинацию X и Y, W = aX + bY , то W также будет иметь нормальное распределение. Кроме того, используя ожидаемое значение и свойства дисперсии, вы можете описать новую случайную переменную с помощью этой сокращенной записи:

Распределение хи-квадрат в эконометрике

В эконометрике вы широко используете распределение хи-квадрат. Распределение хи-квадрат полезно для сравнения оценочных значений дисперсии из выборки с этими значениями, основанными на теоретических предположениях. Поэтому он обычно используется для разработки доверительных интервалов и проверки гипотез для дисперсии населения. Однако сначала вы должны ознакомиться с характеристиками распределения хи-квадрат.

На рисунке показано несколько распределений хи-квадрат, где df1, df2 и df3 указывают на увеличивающиеся степени свободы.

Распределение хи-квадрат обычно используется с оценками дисперсии и основывается на идее, что вы начинаете с нормально распределенной случайной величины, такой как

Используя выборочные данные, вы оцениваете дисперсию этой случайной величины с

Если вы алгебраически манипулируете этой формулой, вы получите распределение хи-квадрат:

Последний шаг, на котором вы делите обе стороны на известную (или предполагаемую) дисперсию популяции, — это то, что стандартизирует вашу выборочную дисперсию к общему масштабу, известному как хи-квадрат.

Эконометрическая оценка и допущения CLRM

Эконометрические методы используются для оценки экономических моделей, которые в конечном итоге позволяют вам объяснить, как различные факторы влияют на какой-либо интересующий вас результат или прогнозировать будущие события. Метод обычных наименьших квадратов (OLS) является наиболее популярным методом проведения регрессионного анализа и оценки эконометрических моделей, потому что в стандартных ситуациях (то есть модель удовлетворяет ряду статистических допущений) она дает оптимальные (наилучшие возможные) результаты.

Доказательство того, что OLS дает наилучшие результаты, известно как теорема Гаусса-Маркова, но доказательство требует нескольких предположений. Эти предположения, известные как предположения классической линейной регрессионной модели (CLRM) , следующие:

  • Параметры модели являются линейными, то есть коэффициенты регрессии не входят в функцию, оцениваемую как экспоненты (хотя переменные могут иметь показатели).
  • Значения для независимых переменных получены из случайной выборки населения, и они содержат изменчивость.
  • Объясняющие переменные не имеют идеальной коллинеарности (то есть, независимая переменная не может быть выражена как линейная функция от любых других независимых переменных).
  • Термин ошибки имеет нулевое условное среднее значение, означающее, что средняя ошибка равна нулю при любом конкретном значении независимой переменной (переменных).
  • Модель не имеет гетероскедастичности (имеется в виду, что дисперсия ошибки одинакова независимо от значения независимой переменной).
  • Модель не имеет автокорреляции (слагаемое ошибки не проявляет систематической зависимости во времени).

Полезные формулы в эконометрике

После получения данных и выбора наилучшей эконометрической модели для вопроса, на который вы хотите ответить, используйте формулы для получения расчетного результата. В некоторых случаях вы должны выполнить эти вычисления вручную (извините). Однако даже если ваша проблема позволяет вам использовать эконометрическое программное обеспечение, такое как STATA, для получения результатов, приятно знать, что делает компьютер.

Вот взгляд на наиболее распространенные оценки из эконометрической модели, а также формулы, используемые для их получения.

Эконометрический анализ: взгляд на гибкость моделей

Возможно, вы захотите позволить вашей эконометрической модели иметь некоторую гибкость, потому что экономические отношения редко бывают линейными. Во многих ситуациях действует «закон» уменьшения предельных выгод и / или увеличения предельных издержек, что подразумевает, что влияние независимых переменных не будет постоянным (линейным).

Точная функциональная форма зависит от вашего конкретного приложения, но наиболее распространенными являются следующие:

Типичные проблемы оценки эконометрических моделей

Если классическая модель линейной регрессии (CLRM) не работает для ваших данных, потому что одно из ее предположений не выполняется, то вам нужно решить проблему, прежде чем завершить анализ. К счастью, одним из основных вкладов эконометрики является разработка методов решения таких проблем или других сложностей с данными, которые делают оценку стандартной модели трудной или ненадежной.

В следующей таблице приведены названия наиболее распространенных проблем оценки, краткое описание каждой из них, их последствия, типичные инструменты, используемые для их обнаружения, и общепринятые методы решения каждой проблемы.

Указание вашей регрессионной модели эконометрики

В эконометрике регрессионная модель является общей отправной точкой анализа. Когда вы определяете свою модель регрессии, вам необходимо учитывать несколько элементов:

  • Экономическая теория, интуиция и здравый смысл должны мотивировать вашу регрессионную модель.
  • Наиболее распространенный метод оценки регрессии, обычные наименьшие квадраты (OLS), получает наилучшие оценки вашей модели, если выполнены предположения CLRM.
  • Предположение, что нормальное распределение члена ошибки важно для проверки гипотез и прогнозирования / прогнозирования.

Когда модель регрессии оценивается, прикладные эконометрики и читатели исследования предполагают, что исследователь выбрал правильные независимые переменные, то есть они действительно могут вызвать изменения в зависимой переменной (интересующий результат). Данные и оценка вашей модели в конечном итоге покажут, какие независимые переменные являются важными факторами, а какие — нет. Однако, прежде чем получить результаты, вы должны предоставить обоснование для выбранных вами переменных.

После того как вы определили модель и получили ваши данные, регрессионный анализ позволяет вам оценить экономические отношения, которые вы определили в модели. Результаты оценки обеспечивают количественное приближение взаимосвязи между независимой и зависимой переменными. МНК является наиболее распространенным методом, используемым для этих расчетов. Как правило, вы полагаетесь на специализированное программное обеспечение для получения ваших оценок. Тем не менее, изначально используя ручные вычисления в ситуациях с одной независимой переменной и относительно небольшим количеством наблюдений, вы можете ознакомиться с техникой OLS и лучше понять алгоритмы и результаты работы программного обеспечения.

Как выбрать метод прогнозирования в эконометрике

В эконометрике процедура прогнозирования может быть весьма разнообразной. Если имеются исторические данные, прогнозирование обычно предполагает использование одного или нескольких количественных методов. Если исторические данные недоступны, или если они содержат значительные пробелы или ненадежны, то прогнозирование может быть качественным. Количественные подходы к прогнозированию в эконометрике включают использование причинно-следственных и / или сглаживающих моделей, тогда как качественное прогнозирование использует экспертный консенсус и / или анализ сценариев.

Изображение показывает традиционную классификацию девяти различных методов прогнозирования. То, что вы видите здесь, не является исчерпывающим, но оно включает в себя наиболее часто используемые методы.

Всегда оценивайте точность своего прогноза, чтобы определить, какая методика прогнозирования лучше всего подходит для вашего конкретного применения.

Десять практических применений эконометрики

Ниже приведен список из десяти интересных практических применений эконометрических методов.

  • Прогнозирование макроэкономических показателей. Некоторые макроэкономисты обеспокоены ожидаемым влиянием монетарной и фискальной политики на совокупные показатели экономики. Модели временных рядов могут использоваться для прогнозирования этих экономических показателей.
  • Оценка воздействия иммиграции на местных работников: иммиграция увеличивает предложение работников, поэтому стандартная экономическая теория предсказывает, что равновесная заработная плата будет снижаться для всех работников. Однако, поскольку иммиграция также может оказывать положительное влияние на спрос, эконометрические оценки необходимы для определения чистого воздействия иммиграции на рынок труда.
  • Выявление факторов, которые влияют на вход и выход фирмы на рынок . Микроэкономическое поле промышленной организации, среди многих интересных вопросов, касается концентрации фирмы и рыночной власти. Теория предполагает, что многие факторы, в том числе существующие уровни прибыли, постоянные затраты, связанные с въездом / выездом и государственное регулирование, могут влиять на структуру рынка. Эконометрическая оценка помогает определить, какие факторы являются наиболее важными для входа и выхода фирмы.
  • Определение влияния законов о минимальной заработной плате на уровень занятости: минимальная заработная плата является примером минимального уровня цен, поэтому более высокая минимальная заработная плата должна создавать избыток рабочей силы (более высокий уровень безработицы). Однако влияние минимальных цен, таких как минимальная заработная плата, зависит от формы кривых спроса и предложения. Поэтому экономисты труда используют эконометрические методы для оценки фактического эффекта такой политики.
  • Поиск взаимосвязи между методами управления и производительностью труда . Использование высокопроизводительных методов работы (таких как автономия работников, гибкий график работы и другие политики, призванные обеспечить удовлетворение работников) стало более популярным среди менеджеров. В какой-то момент, однако, стоимость реализации этих политик может превысить преимущества производительности. Эконометрические модели могут использоваться для определения того, какая политика ведет к наибольшей отдаче и повышает эффективность управления.
  • Измерение связи между страховым покрытием и индивидуальными результатами в отношении здоровья. Одним из аргументов в пользу увеличения доступности (и доступности) медицинского страхового покрытия является то, что оно должно улучшить результаты в отношении здоровья и сократить общие медицинские расходы. Экономисты в области здравоохранения могут использовать эконометрические модели с агрегированными данными (из стран) о показателях медицинского покрытия и результатах в отношении здоровья или использовать данные на индивидуальном уровне с качественными показателями страхового покрытия и состояния здоровья.
  • Получение эффекта объявления дивидендов на цены фондового рынка и поведение инвесторов. Дивиденды представляют собой распределение прибыли компании ее акционерам. Иногда объявление о выплате дивидендов может рассматриваться как хорошая новость, когда акционеры стремятся получить инвестиционный доход, но иногда они могут рассматриваться как плохие новости, когда акционеры предпочитают реинвестировать твердую прибыль за счет нераспределенной прибыли. Чистый эффект от объявления дивидендов можно оценить с помощью эконометрических моделей и данных о поведении инвесторов.
  • Прогнозирование увеличения доходов в ответ на маркетинговую кампанию . Сфера маркетинга становится все более зависимой от эмпирических методов. Менеджер по маркетингу или продажам может захотеть определить связь между маркетинговыми усилиями и продажами. Сколько дополнительного дохода генерируется из дополнительного доллара, потраченного на рекламу? Какой тип рекламы (радио, телевидение, газеты и т. Д.) Оказывает наибольшее влияние на продажи? Эти типы вопросов могут быть решены с помощью эконометрических методов.
  • Расчет влияния налоговых льгот фирмы на расходы на НИОКР. Налоговые льготы на исследования и разработки (НИОКР) призваны стимулировать фирмы к участию в деятельности, связанной с инновациями и повышением качества продукции. Эконометрические оценки могут использоваться для определения того, как изменения в налоговых льготах влияют на расходы на НИОКР и как эффекты распределения могут создавать эффекты налоговых льгот, которые зависят от размера фирмы.
  • Оценка влияния политики ограничения и торговли квотами на уровни загрязнения: экономисты-экологи обнаружили, что сочетание правовых ограничений на выбросы с созданием рынка, который позволяет фирмам приобретать «право на загрязнение», может снизить общий уровень загрязнения. Эконометрические модели могут использоваться для определения наиболее эффективного сочетания государственных нормативов, разрешений на загрязнение и налогов для улучшения условий окружающей среды и сведения к минимуму воздействия на фирмы.

Эконометрика: выбор функциональной формы вашей регрессионной модели

В эконометрике стандартная процедура оценки для классической модели линейной регрессии, обыкновенных наименьших квадратов (OLS), может приспосабливать сложные отношения. Следовательно, у вас есть значительная гибкость в разработке теоретической модели. Вы можете оценить линейные и нелинейные функции, включая, но не ограничиваясь

  • Полиномиальные функции (например, квадратичные и кубические функции)
  • Обратные функции
  • Функции журнала (log-log, log-linear и linear-log)

Во многих случаях на зависимую переменную в регрессионной модели могут влиять как количественные, так и качественные факторы. Помимо отслеживания единиц измерения или преобразования в логарифмическую шкалу, использование количественных переменных в регрессионном анализе обычно не вызывает затруднений. Качественные переменные, однако, требуют преобразования в количественную шкалу с использованием фиктивных переменных, которые равны 1, когда присутствует конкретная характеристика, и 0 в противном случае. (Обратите внимание, что когда возможно более двух качественных результатов, число фиктивных переменных, которое вам нужно, равно числу результатов минус один.) Использование количественных и качественных переменных обычно приводит к более богатым моделям с более информативными результатами.

Хотя некоторые эксперименты с точной формой вашей регрессионной модели могут быть полезными, найдите время, чтобы методично продумать вопросы спецификации. Убедитесь, что вы можете объяснить, почему вы выбрали конкретные независимые переменные для вашей модели. Вы также должны иметь возможность обосновать функциональную форму, которую вы выбрали для модели, даже если вы предполагали простую линейную связь между вашими переменными. Проверьте предположения классической модели линейной регрессии (CLRM) и внесите изменения в модель по мере необходимости. Наконец, потратьте некоторое время на изучение чувствительности ваших результатов, внеся небольшие изменения в переменные (иногда на них влияют результаты ваших тестов CLRM), включенных в модель и функциональную форму отношений. Если ваши результаты стабильны к этим типам вариаций.

Работа со специальными зависимыми переменными в эконометрике

Многие экономические явления имеют дихотомический характер; другими словами, результат либо происходит, либо не происходит. Дихотомические результаты являются наиболее распространенным типом дискретных или качественных зависимых переменных, анализируемых в экономике. Например, студент, который обращается в аспирантуру, будет принят или нет. Если вам интересно определить, какие факторы способствуют поступлению в аспирантуру, то ваш результат или зависимая переменная дихотомичны.

Как и в случае количественных результатов, для объяснения возникновения этих качественных событий можно использовать регрессионные модели. Однако они обычно требуют особого подхода, поскольку могут создать некоторые проблемы для традиционного регрессионного анализа. Эконометрики разработали методы для решения этих проблем. Методы могут быть количественно обременительными и практически невозможными без компьютера, но понимание структуры моделей необходимо, если вы хотите точно интерпретировать результаты работы компьютера.

Подобно качественным переменным, когда количественные переменные с ограниченными значениями используются в качестве зависимых переменных, они также создают уникальные обстоятельства для регрессионного анализа. Проблема, как и в случае с качественными переменными, заключается в том, что ограниченные (цензурированные или усеченные) значения приводят к тому, что предположения о распределении классической модели линейной регрессии оказываются несостоятельными. Предположим, вы заинтересованы в оценке влияния изменений цен на спрос на билеты на концерт U2. Одна проблема состоит в том, что измерение этого спроса ограничено возможностями арен, забронированных для их тура. После того, как концерт распродан, вы не сможете наблюдать, насколько спрос превысил предел арены. Вы можете наблюдать только ограниченные значения для многих количественных переменных (например, различных типов процентов, баллов SAT, средних баллов и т. Д.).

К счастью, эконометрики разработали методы обработки ограниченных / ограниченных зависимых переменных, которые аналогичны тем, которые используются для качественных зависимых переменных.

Следующий список содержит специальные зависимые переменные ситуации и названия методов, разработанных эконометристами для их обработки:

  • Дихотомическая или бинарная зависимая переменная: дискретная переменная с двумя исходами, обычно 0 или 1. Обрабатывается с помощью моделей Probit / Logit.
  • Цензурированная зависимая переменная: непрерывная переменная, в которой некоторые из фактических значений были ограничены до некоторого заранее определенного минимального или максимального значения. Работает с моделью Tobit (censored normal).
  • Усеченная зависимая переменная: непрерывная переменная, в которой некоторые фактические значения не наблюдаются, если они меньше некоторого заранее определенного минимального значения или больше некоторого заранее определенного максимального значения. Обрабатывается с усеченной нормальной моделью.
  • Самостоятельно выбранная выборка: пропущенные значения для зависимой переменной из-за неслучайных решений об участии от интересующей группы. Обрабатывается с помощью модели выбора Хекмана.
  • Полихотомная или зависимая переменная с множественным ответом: дискретная переменная с более чем двумя результатами. Работа с полиномиальной моделью Probit / Logit или заказной моделью Probit / Logit (рассматривается в более продвинутых курсах эконометрики).
  • Дискретно-зависимая переменная: неотрицательная дискретная переменная, которая принимает целочисленные значения (0, 1, 2,…). Работает с моделью Пуассона или отрицательной биномиальной моделью (рассматривается в более продвинутых курсах по эконометрике).

Линейно-логическая модель в эконометрике

Если вы используете натуральные логарифмические значения для своих независимых переменных ( X ) и сохраняете зависимую переменную ( Y ) в ее исходном масштабе, эконометрическая спецификация называется линейно-логической моделью (в основном зеркальным отображением логарифмической модели). Эти модели обычно используются, когда влияние вашей независимой переменной на вашу зависимую переменную уменьшается по мере увеличения значения вашей независимой переменной.

Поведение функции аналогично квадратичному, но отличается тем, что никогда не достигает максимального или минимального значения Y.

Исходная модель не является линейной по параметрам, но логарифмическое преобразование генерирует желаемую линейность. (Напомним, что линейность параметров является одним из предположений OLS.)

Рассмотрим следующую модель расходов на потребление, которая зависит от некоторого автономного потребления и дохода:

где Y представляет расходы на потребление,

является автономным потреблением (потребление, которое не зависит от дохода), X является доходом, и

это предполагаемое влияние дохода на потребление.

Вы, вероятно, знакомы с отношениями между доходом и потреблением. В своих курсах по экономическим принципам вы, вероятно, называли это кривой Энгеля . Возможно, вы не видели математическую функцию, стоящую за этим, но вы видели графическое изображение.

Если вы начнете с функции вида

где значение Y для данного X может быть получено, только если влияние известно, тогда вы можете оценить влияние, используя OLS, только если вы используете преобразование журнала. Если вы берете натуральное бревно с обеих сторон, вы в конечном итоге

где

неизвестная константа и

это неизвестное воздействие X . Вы можете оценить это с помощью OLS, просто используя натуральные логарифмические значения для независимой переменной ( X ) и исходный масштаб для зависимой переменной ( Y ).

Используя исчисление с простой линейно-логической моделью, вы можете увидеть, как следует интерпретировать коэффициенты. Начните с модели

и дифференцировать его, чтобы получить

Член в правой стороне представляет собой процентное изменение в X , и этот термин на левой стороне , является изменение единицы в Y .

В экономике многие ситуации характеризуются уменьшением предельной доходности. Линейно-логическая модель обычно хорошо работает в ситуациях, когда влияние X на Y всегда сохраняет один и тот же знак (положительный или отрицательный), но его влияние уменьшается.

Предположим, используя случайную выборку школьных округов, вы получите следующие регрессионные оценки:

где Y — средний балл SAT по математике, а X — расходы на одного учащегося. Расчетный коэффициент

подразумевает, что увеличение расходов на одного студента на 1 процент увеличивает средний балл по математике SAT на 0,65 балла.

Если вы оцениваете линейную логарифмическую регрессию, пара результатов для коэффициента на X дает наиболее вероятные отношения:

Часть (а) показывает линейно-логическую функцию, где влияние независимой переменной является положительным.

Часть (b) показывает функцию линейного логарифма, где влияние независимой переменной отрицательно.

 

Совершенная мультиколлинеарность и ваша эконометрическая модель

Получить представление о совершенной мультиколлинеарности, что нечасто, легче, если вы можете изобразить эконометрическую модель, которая использует две независимые переменные, такие как:

Предположим, что в этой модели

где альфы являются постоянными. Подменяя, вы получаете

что указывает на то, что модель разрушается и не может быть оценена, как первоначально указано.

Результатом совершенной мультиколлинеарности является то, что вы не можете получить никаких структурных выводов об исходной модели, используя выборочные данные для оценки. В модели с идеальной мультиколлинеарностью ваши коэффициенты регрессии неопределенны, а их стандартные ошибки бесконечны.

На следующем рисунке STATA используется для создания переменной, которая является линейной комбинацией другой переменной. Затем график двух переменных строится и включает их в качестве независимых переменных в регрессионную модель. Заметьте, однако, что результаты не содержат оценки параметров для обеих переменных. Получение индивидуальных коэффициентов регрессии для каждой переменной невозможно, если вы обладаете идеальной мультиколлинеарностью.

Большинство эконометрических программ идентифицируют идеальную мультиколлинеарность и отбрасывают одну (или более) переменную до предоставления результатов оценки, заботясь о проблеме для вас. Хорошей новостью является то, что вы можете избежать совершенной мультиколлинеарности, проявив некоторую осторожность при создании переменных и тщательно выбирая, какие из них включить в качестве независимых переменных.

Используйте тест Парка для проверки гетероскедастичности

Тест Парка начинается с предположения о конкретной модели гетероскедастического процесса. В частности, предполагается, что гетероскедастичность может быть пропорциональна некоторой степени независимой переменной ( k ) в модели. Это предположение можно выразить как

Вы можете получить линеаризованную версию модели Park, используя преобразование журнала:

Потому что значения для

на практике не известны

рассчитываются из остатков и используются в качестве прокси для

  • Оцените модель, используя OLS:
  • Получите квадрат остатков после оценки вашей модели:
  • Оцените модель, используя OLS:
  • Изучите статистическую значимость альфа, используя t- статистику :

Значение

от оценки регрессии

является оценкой постоянной (гомоскедастической) части дисперсии ошибки. Следовательно, если оценка альфа-коэффициента является статистически значимой, то у вас есть доказательства гетероскедастичности. Если нет, вы не сможете отвергнуть нулевую гипотезу гомоскедастичности.

Используя данные игроков Высшей лиги бейсбола, вы можете оценить модель с натуральным логарифмом стоимости контракта игрока в качестве зависимой переменной и нескольких характеристик игрока в качестве независимых переменных.

Независимые переменные включают в себя трехлетние средние значения процента просадки игрока (slg_3_avg) и «летучих мышей» (ab_3_avg), возраст игрока и срок пребывания игрока (годы) в текущей команде. На рисунке показан пошаговый процесс выполнения теста Park в STATA.

Если есть гетероскедастичность, то переменная, отвечающая за нее , — at-bats . В этом случае коэффициент для переменной ln a bavg (с использованием натурального логарифма ab_3_avg, как указано в тесте Park) является статистически значимым с p- значением 0,03. Следовательно, вы можете отказаться от гипотезы гомоскедастичности.