2015年在上 Ghosh (2015) 的课时,进而接触到 Ramsey (1969) 的 Ramsey’s RESET test 课上发现已经有成熟的 R 函数 lmtest::resettest
完成这一工作。 查看 help 文档,可以发现相关的 paper。 但是 Ramsey (1969) 写的过于复杂,主要是为了证明合理性,这里推荐查看 Wooldridge (2012) 更加通俗易懂。
查看 help 文档,
resettest(formula, power = 2:3, type = c("fitted", "regressor",
"princomp"), data = list(), vcov = NULL, ...)
这里可以使用 \(\hat y^2\) 也可以使用主成分分析的PC1。
下面查看这个方法的内在逻辑。
More specifically, it tests whether non-linear combinations of the fitted values help explain the response variable. wikipedia
参考 Wooldridge (2012),这个方法原先是利用F检验检验预测值的非线性组合是否有助于解释因变量。 从特征工程的角度,这个方法,可以作为一个强变量,代表任意的二次交叉项。
并且在非线性的次方数上
Ghosh, Damayanti. 2015. “Validity of a Regression Study.”
Ramsey, J. B. 1969. “Tests for Specification Errors in Classical Linear Least-Squares Regression Analysis.” Journal of the Royal Statistical Society 31 (2): 350–71.
Wooldridge, Jeffrey M. 2012. Introductory Econometrics: A Modern Approach. 5th ed. South-Western College Pub.