参考 Github Pages 社会网络模型和空间计量部分有重叠部分。
下列举例一个关系变量 (Link based features),参考 Oskarsdottir and Baesens (2019)
knitr::include_graphics("figure/adj-matrix.png")
knitr::include_graphics("figure/avg-age.png")
这里值得注意的是
adj 矩阵每一行表示第i样本跟第j样本的邻近关系,加总后,就知道 perfer R 的邻居数量了。
如果是省份数据,可以将 adj 矩阵拆分,变成 省份矩阵 和 id-省份矩阵,进行相乘
\[\text{id by province}_{n \times 34} \cdot \text{province}_{34 \times 34} \cdot \text{province by id}_{34 \times n} \cdot \text{x}_{n \times 1} = \text{modifed x}_{n \times 1}\]
然后相乘关系,可以采用 gather 函数完成,参考 空间滞后一期的特征变量提取
Oskarsdottir, Maria, and Bart Baesens. 2019. “Predictive Analytics Using Networked Data in R.” DataCamp. 2019. https://www.datacamp.com/courses/predictive-analytics-using-networked-data-in-r.