Разница между Т-тестом и линейной регрессией (с таблицей)

Оглавление:

Anonim

T-тест и линейная регрессия - это термины, относящиеся к выводимой статистике, то есть статистическому методу, который помогает нам делать обобщения и прогнозы относительно совокупности, взяв небольшую, но иллюстративную выборку этой совокупности. В выводимой статистике обычно используются три типа методологий: доверительные интервалы, проверка гипотез и регрессионный анализ.

Т-тест против линейной регрессии

Разница между Т-тестом и линейной регрессией заключается в том, что линейная регрессия применяется для выяснения корреляции между одной или двумя переменными на прямой линии. В то время как T-тест является одним из инструментов проверки гипотез, применяемых к коэффициентам наклона или коэффициентам регрессии, полученным из простой линейной регрессии.

В то время как T-тест является одним из тестов, используемых при проверке гипотез, линейная регрессия является одним из типов регрессионного анализа. Линейная регрессия используется для определения степени линейной связи между выходной переменной (зависимой переменной) и одной или несколькими переменными-предикторами (независимыми переменными).

T-тест - это одна из проверок гипотезы, проводимая для того, чтобы выяснить, заметна ли разница между средними значениями двух групп, то есть независимо от того, произошли ли эти различия случайно или нет.

Таблица сравнения Т-теста и линейной регрессии (в табличной форме)

Параметр сравнения Т-тест Линейная регрессия
Статистический метод T-тест - это один из инструментов гипотетического тестирования, который, в свою очередь, является методом логической статистики. Линейная регрессия - это один из видов регрессионного анализа, который также является методом логической статистики.
использование T-тест используется для сравнения средних значений двух различных наборов наблюдаемых данных и для определения того, насколько такое различие является «случайным». Линейная регрессия используется для поиска взаимосвязи между одной зависимой или конечной переменной и одной или несколькими независимыми или предикторами.
Типы T-тесты в основном бывают трех типов, а именно t-критерий независимой выборки (сравнение среднего значения двух наборов данных), парный T-тест выборки (сравнение средних значений одних и тех же наборов данных в разные интервалы) и T-критерий одной выборки. тест (сравнение среднего значения одного набора данных с известным средним). Существует два типа линейной регрессии, а именно простая линейная регрессия (состоящая из одной зависимой и одной независимой переменных) и множественная линейная регрессия (состоящая из одной зависимой переменной и двух или более независимых переменных).
Практическое применение T-тест можно использовать для проверки доходности двух разных портфелей, управляемых с помощью двух разных стратегий инвестирования. Впервые его использовали для проверки стабильного качества стаута в пивоваренной компании. Линейная регрессия в основном используется для наблюдения за поведением клиентов, ценообразования, прогнозирования продаж компании, погоды, роста ВВП и т. Д.
Количество переменных или наборов, которые можно использовать. В T-тесте можно использовать только два набора данных или группы. Хотя существует только один регрессанд, количество регрессоров может быть больше двух.

Что такое Т-тест?

T-тест - это один из инструментов, используемых при проверке гипотез для сравнения двух разных наборов данных и их средних или средних значений. К другим относятся тест дисперсионного анализа, Z-тест, критерий хи-квадрат и F-тест.

T-тест используется для проверки существенной разницы между двумя наборами данных. Он используется, чтобы определить, насколько такая разница случайна.

Впервые его использовал Уильям Сили Госсет, химик, работавший в пивоваренной компании Guinness, чтобы следить за стабильным качеством стаутов.

Постепенно он был модернизирован, и теперь он относится к любым тестам гипотез, в которых данные при анализе должны быть эквивалентны t-распределению (колоколообразная кривая распределения с более тяжелыми хвостами), если нулевая гипотеза (предположение о том, что связи нет) существует между наборами данных) оказывается правильным.

Для стандартной интерпретации и проверки это зависит от определенных предположений о выборке населения.

Такие допущения включают данные, которые выбираются случайным образом, переменные данных, которые подчиняются нормальному распределению, дисперсию, которая неизвестна и считается однородной, и шкалу измерения, которая при применении к собранным данным дает непрерывную линию.

Существует три типа Т-тестов:

Как подход к проверке гипотез, Т-тест довольно консервативен. Его можно применить только к двум наборам данных, и он считается подходящим только для небольших наборов данных.

Что такое линейная регрессия?

Линейная регрессия - это метод логической статистики, который пытается объяснить корреляцию между зависимой переменной (Y) и одной или несколькими независимыми переменными (X) с помощью прямой линии. В основном он касается трех типов вопросов:

  1. Правильно ли предсказывает конечную переменную набор независимых переменных?
  2. Если да, то какие наиболее важные независимые или объясняющие переменные существенно влияют на зависимую переменную или переменную результата?
  3. И, наконец, в какой степени изменение этих независимых или независимых переменных влияет на результат или зависимую переменную?

Связь между выходной переменной и независимыми переменными считается положительной, если увеличение последней приводит к увеличению первой.

Точно так же связь между зависимой и независимой переменной считается отрицательной, если первая уменьшается с увеличением второй.

У линейной регрессии есть три применения:

  1. Для определения силы независимых переменных, т.е. в какой степени они влияют на независимую переменную.
  2. Для прогнозирования изменения зависимой переменной, вызванного независимыми переменными.
  3. Для прогнозирования будущих тенденций и ценностей.

В основном есть два типа линейной регрессии: Простая линейная регрессия который состоит из одной зависимой переменной и одной независимой переменной и Множественная линейная регрессия который состоит из зависимой переменной и двух или более независимых переменных.

Основные различия между Т-тестом и линейной регрессией

Вывод

И Т-тест, и линейная регрессия попадают в более широкие рамки статистических выводов, которые используются, чтобы делать предположения о конкретной совокупности с использованием небольшой выборки. Они играют разные роли и являются важными инструментами для определения общих характеристик населения.

Хотя линейная регрессия помогает делать определенные прогнозы относительно конкретной выборки, например поведение клиентов, T-тест помогает проверить применимость гипотезы к выборке.

Разница между Т-тестом и линейной регрессией (с таблицей)