参考 Github Pages 社会网络模型和空间计量部分有重叠部分。

下列举例一个关系变量 (Link based features),参考 Oskarsdottir and Baesens (2019)

knitr::include_graphics("figure/adj-matrix.png")

knitr::include_graphics("figure/avg-age.png")

这里值得注意的是

  1. 这的矩阵相乘,类似于空间计量中,空间权重矩阵和对应变量的相乘
  2. adj 矩阵本身就是空间权重矩阵的定义,注意对角线是空的。
  3. 这里的变量解释非常的 native

adj 矩阵每一行表示第i样本跟第j样本的邻近关系,加总后,就知道 perfer R 的邻居数量了。

如果是省份数据,可以将 adj 矩阵拆分,变成 省份矩阵 和 id-省份矩阵,进行相乘

\[\text{id by province}_{n \times 34} \cdot \text{province}_{34 \times 34} \cdot \text{province by id}_{34 \times n} \cdot \text{x}_{n \times 1} = \text{modifed x}_{n \times 1}\]

然后相乘关系,可以采用 gather 函数完成,参考 空间滞后一期的特征变量提取

Oskarsdottir, Maria, and Bart Baesens. 2019. “Predictive Analytics Using Networked Data in R.” DataCamp. 2019. https://www.datacamp.com/courses/predictive-analytics-using-networked-data-in-r.