2015年在上 Ghosh (2015) 的课时,进而接触到 Ramsey (1969) 的 Ramsey’s RESET test 课上发现已经有成熟的 R 函数 lmtest::resettest完成这一工作。 查看 help 文档,可以发现相关的 paper。 但是 Ramsey (1969) 写的过于复杂,主要是为了证明合理性,这里推荐查看 Wooldridge (2012) 更加通俗易懂。

查看 help 文档,

resettest(formula, power = 2:3, type = c("fitted", "regressor",
  "princomp"), data = list(), vcov = NULL, ...)

这里可以使用 \(\hat y^2\) 也可以使用主成分分析的PC1。

下面查看这个方法的内在逻辑。

More specifically, it tests whether non-linear combinations of the fitted values help explain the response variable. wikipedia

参考 Wooldridge (2012),这个方法原先是利用F检验检验预测值的非线性组合是否有助于解释因变量。 从特征工程的角度,这个方法,可以作为一个强变量,代表任意的二次交叉项。

并且在非线性的次方数上

  1. Ghosh (2015) 使用了 2:4
  2. Wooldridge (2012) 使用了 2:3

Ghosh, Damayanti. 2015. “Validity of a Regression Study.”

Ramsey, J. B. 1969. “Tests for Specification Errors in Classical Linear Least-Squares Regression Analysis.” Journal of the Royal Statistical Society 31 (2): 350–71.

Wooldridge, Jeffrey M. 2012. Introductory Econometrics: A Modern Approach. 5th ed. South-Western College Pub.