1. 使用 RMarkdown 的 child 参数,进行文档拼接。
  2. 这样拼接以后的笔记方便复习。
  3. 相关问题提交到 Issue

1 中日和解大纲

1.1 总目标

分析“中日为何没能实现和解”

1.2 假设

1.2.1 影响因素与分析方法

1.2.1.1 1.国家经济实力

经济指标等数据

1.2.1.2 2.国际层面的竞争性因素

报纸的文本分析

1.2.1.3 3.国内层面的民族主义倾向

报纸的文本分析

1.2.1.3.1 注意

影响因素具体要从媒体解读中总结

1.3 步骤

确定影响因素\(\to\)使用经济学,政治学(主要为和解学)理论分析\(\to\)验证假设

1.4 文本分析所需要达成的目标

验证国际层面的竞争性因素和国内层面的民族主义倾向

通过1949年后的中日报纸,验证分析六大主题的中日关系发展进程

注:目前的六大主题是由中国媒体提炼出来的,提炼日本媒体后可能会有变化。

1.4.1 主题

主题1:中日双边合作

主题2:中美经贸带动世界经济增长

主题3:中国社会发展与建设

主题4:中日企业合作

主题5:中日历史与抗战认识问题

主题6:世界和平和国际安全

1.4.2 对象媒体

中国:人民日报

日本:读卖新闻(読売新聞,Yomiuri),每日新闻(毎日新聞,Mainichi),朝日新闻(朝日新聞,Asahi),(日本経済新聞(日経),Nikkei)

1.5 和解学理论和经济学理论需要达成的目标

衔接文本分析和假设。

解释中日和解进程中各个行为主体的行动。

解释为什么中日没有达成和解。

推测中日达成和解的条件。

2 公共关系 case study

Sullivan and Renz (2010) 探索国家和地区精英对俄罗斯远东-中国东北区域合作与发展的态度。作者认为媒体,特别是官方媒体的报道能够很好地反映精英们关心的问题和他们的态度。

1. 文章结构

本文大致可以分为三个部分。第一部分主要介绍中俄当前关系和俄罗斯远东-中国东北的地区合作,以及作者重点关注的问题:中国移民问题及其对中俄边疆地区合作的影响,作了文献综述。第二部分是主体部分,进行文本分析。第三部分是结论,根据文本分析的结果,媒体对中国移民问题的关注并没有此前一些研究所说的那么突出,经济和地区发展还是最主要的关注点,并展望了未来合作。

2. 文本数据来源

本文收集了2007年1月1日至2008年12月31日期间俄罗斯和中国一些媒体的报道,中国的媒体有国家级的《人民日报》,地区级的《黑龙江日报》和《吉林日报》;俄罗斯的媒体有国家级的《俄罗斯报》和《消息报》商业版,地区级的《阿穆尔斯卡娅真理报》和《蒂库肯斯卡娅纪韦兹达报》。

3. 主题确定

作者通过文献综述确定了双边关系的5个话题大类:Economy(官方经济,比如投资),Unofficial economy(非官方经济,比如非法贸易),Law and order(法律和秩序),Regional issues(地区话题)和State interactions(国家间互动)(寻找主题本文未使用任何分析,而是比较主观地通过阅读文献来归纳)。这5个大类被进一步划分为13个子类。通过对样本的仔细阅读,归纳出一个有140个适当的文字表述组成的词典,这140个表述是俄语和汉语都有的。此外作者又额外为俄语和汉语各添加了40个表述,这部分额外表述有的是只出现在一种语言中。

4. 覆盖率及比值计算

为了计算话题的覆盖率,本文使用了computer-assisted content analysis (CCA),具体而言是一个叫Yoshikoder CCA的软件包。这个软件包根据匹配词典中的内容来估计出一段文字属于某一个话题的概率。Yoshikoder CCA号称可以处理任何语言,所以作者是按四类(中文中央/地方,俄语中央/地方)分别把对应文本导入这个软件,然后软件匹配词典中的表述,生成覆盖率数值。作者假设与某一主题相关的文字的数量表达了发言者对该主题的重视程度。计算方式是:对俄语,一个主题的数值是该主题对应的词典中的表述占文本总单词数的比例;对中文,该数值是该主题对应的词典中的表述占总共的“句子”(以逗号来识别)数的比例。因为俄语和中文的计算方式不同,所以在不同语言的文本中采用比率来比较两个话题的相对重要性。比率为1代表这两个话题在这一类型的媒体中得到同等的关注。然后作者给出了4种媒体上(中国国家级/中国地区级/俄罗斯国家级/俄罗斯地区级)所有大类之间的和挑选的某些子类之间的比率和对应的95%置信区间。比如,在中文中央媒体中,经济的覆盖率是10%,非官方经济的覆盖率是5%,那对中文中央媒体而言,经济与非官方经济的覆盖率的比值是2,这就是经济对非官方经济的相对重要性,大于1,说明中文中央媒体更关注经济。

3 VAR case study

本文将情感分析与时间序列结合,分析了比特币价格与相关基本经济变量、技术变量及情绪变量之间的关系,文章从两个方面为我们的实证研究提供了指导:第一、在对推特文本进行情感分析时,通过机器学习算法SVMs以打分的方式塑造了情绪变量作为解释变量;第二,进行时间序列分析时,首先检测各解释变量和被解释变量序列平稳性,对非平稳序列d阶差分转为平稳序列以避免伪回归发生,同时对同阶单整的变量进行协整检验,观察变量间是否存在长期关系;其次,将通过差分所得的平稳序列与原平稳序列进行OLS回归,并观察它们的显著性,以探究短期内解释变量与非解释变量的关系;再次,对显著的解释变量滞后三期同样进行OLS回归,可以观察这些滞后项对被解释变量的影响;最后,对于长期解释变量与被解释变量之间的关系及短期动态向长期的调整速度,通过建立向量误差修正模型(VESM)解决。(Giaglis et al. 2015)

4 VAR 和 VECM

@AdamYuShao

张成思 (2011, 第10章),将 AR(p)、VAR(p)、VECM(p) 进行关联推导 VECM(p)。

\[AR(p) = \alpha(L) y_{t}=c+\varepsilon_{t}\]

\[\alpha(z)=1-\alpha_{1} z-\alpha_{2} z^{2}-\cdots-\alpha_{p} z^{p}=0\]

\[\alpha^{*}(L) \Delta y_{t}=c+\alpha y_{t-1}+\varepsilon_{t}\]

\[\begin{array}{l} \alpha=-\alpha(1)=1-\left(\sum_{i=1}^{p} \alpha_{i}\right) \\ \alpha^{*}(L)=1-\sum_{i=1}^{p-1} \phi_{i} L^{i} \\ \phi_{i}=-\sum_{j=i+1}^{p} \alpha_{j} \end{array}\]

同理地,当\(\boldsymbol{Y}\)为向量时,

\[VAR(p) = \boldsymbol{\Phi}(L) \boldsymbol{Y}_{t}=\boldsymbol{C}+\boldsymbol{\varepsilon}_{t}\]

\[|\boldsymbol{\Phi}(z)|=0\]

\[\boldsymbol{\Phi}^{*}(L) \Delta \boldsymbol{Y}_{t}=\boldsymbol{C}+\boldsymbol{\Pi} \boldsymbol{Y}_{t-1}+\boldsymbol{\varepsilon}_{t}\]

\[\left\{\begin{array}{l} \boldsymbol{\Pi}=\boldsymbol{\Phi}(1)=\sum_{i=1}^{p} \boldsymbol{\Phi}_{i}-\boldsymbol{I}_{n} \\ \boldsymbol{\Phi}^{*}(L)=\boldsymbol{I}_{n}-\sum_{i=1}^{p-1} \boldsymbol{\Phi}_{i} L^{i} \\ \boldsymbol{\varphi}_{i}=-\sum_{j=i+1}^{p} \boldsymbol{\Phi}_{j} \end{array}\right.\]

可以扩展地,

构建协整矩阵 \(\boldsymbol{B}^{\prime}\),满足

\[\boldsymbol{Z}_{t}=\boldsymbol{B}^{\prime} \boldsymbol{Y}_{t}\]

\[\begin{aligned} \boldsymbol{\Phi}^{*}(L) \Delta \boldsymbol{Y}_{t} &=\boldsymbol{C}+\boldsymbol{A} \boldsymbol{B}^{\prime} \boldsymbol{Y}_{t-1}+\boldsymbol{\varepsilon}_{t} \\ &=\boldsymbol{C}+\boldsymbol{A} \boldsymbol{Z}_{t-1}+\boldsymbol{\varepsilon}_{t} \end{aligned}\]

  1. 在长期情况下 \(Z_{t}=\boldsymbol{B}^{\prime} \boldsymbol{Y}_{t}=\mathbf{0}\)
  2. 在短期情况下 \(\boldsymbol{A Z}_{t-1}=\boldsymbol{A B}^{\prime} \boldsymbol{Y}_{t-1}\) 进行修正

张成思 (2011) 对于向量形式的自回归模型,即VAR(p)模型: \[\Phi(L)Y_t=C+\epsilon_t\] 其中\(\Phi(L)\)为滞后算子多项式: \[\Phi(L)=I_n-\Phi_1L-\Phi_2L^2-···-\Phi_pL^p\]

含有\(n\)个变量的VAR(p)模型可以写成向量形式的ADF模型,推导过程: \[Y_t=C+\Phi_1Y_{t-1}+\Phi_2Y_{t-2}+···+\Phi_pY_{t-p}+\epsilon_t\] \[Y_t-Y_{t-1}=C+(\Phi_1-I_n)Y_{t-1}+\Phi_2Y_{t-2}+···+\Phi_pY_{t-p}+\epsilon_t\\=C+[-\Phi_p(Y_{t-p+1}-Y_{t-p})-(\Phi_{p-1}+\Phi_p)(Y_{t-p+2}-Y_{t-p+1})-···-(\Phi_3+\Phi_4+···+\Phi_p)(Y_{t-2}-Y_{t-3})-(\Phi_2+\Phi_3+···+\Phi_p)(Y_{t-1}-Y_{t-2})]\\+(\Phi_1+\Phi_2+···+\Phi_p-I_n)Y_{t-1}+\epsilon_t\] \[\Delta Y_t=C-\sum_{i=2}^{p}\sum_{j=i}^{p}\Phi_j\Delta Y_{t-(i-1)}+(\sum_{i=1}^{p}\Phi_i-I_n)Y_{t-1}+\epsilon_t\]

\[\Phi^*(L)\Delta Y_t=C+\Pi Y_{t-1}+\epsilon_t\]

其中: \[ \begin{equation} \left\{ \begin{array}{lr} \Pi=\sum_{i=1}^{p}\Phi_i-I_n \\ \Phi^*(L)=I_n+\sum_{i=1}^{p-1}\sum_{j=i+1}^{p}\Phi_jL^i\\ \end{array} \right. \end{equation} \]

对于含有n个变量的VAR模型,当对应的矩阵\(\Pi\)的秩介于0和\(n\)之间的时候,即\(0<r<n\),这\(n\)个变量之间存在\(r\)个协整关系。让我们定义一个\(r\)维的矩阵\(B\),其中\(B\)的列含有\(r\)个不同的线性独立协整向量,所以\(rank(B)=r\)

接下来定义: \[Z_t=B^T Y_t\] 因为\(rank(\Pi)=r\),而矩阵\(B^t\)的行含有\(r\)个来自\(\Pi\)的线性无关行,所以,矩阵\(\Pi\)的所有\(n\)个行可以写成矩阵\(B^t\)的组合,即\(\Pi=AB^T\)。如果把\(\Pi=AB^T\)代入VAR模型的表达式中,就可以获得: \[\Phi^*(L)\Delta Y_t=C+AB^TY_{t-1}+\epsilon_t=C+AZ_{t-1}+\epsilon_t\] 这就是VECM的表达形式。

从长期来看,即所谓的均衡状态或者静止状态,这样的关系精确地存在,所以在长期,我们有: \[Z_t=B^TY_t=0\]

然而,从短期来看,例如对于每个确定的时刻\(t\),都存在偏离协整关系\(B^TY_t\)的成分。这种偏离代表了这些长期关系在短期内的一定程度的非均衡状态,所以偏离成分一般被称为误差。

因此,\(AZ_{t-1}=AB^TY_{t-1}=0\)促使\(\Delta Y_t\)增加或者减少,从而使得\(B^TY_t\)朝着它的长期均值移动。这种增加或者减小的变化,实际上是一种调整,所以称为误差修正。

矩阵\(A\)衡量了\(Y_t\)中每个变量是如何调整,从而回复到长期的均衡关系的水平上。所以,矩阵\(A\)经常被称为调整系数。另外,在实践中,经常对协整向量\(B\)进行标准化。

附录

参考文献

Giaglis, George, Ifigeneia Georgoula, Dimitrios Pournarakis, Christos Bilanakos, and Dionisios Sotiropoulos. 2015. “Using Time-Series and Sentiment Analysis to Detect the Determinants of Bitcoin Prices.” In SSRN Electronic Journal. https://doi.org/10.2139/ssrn.2607167.

Sullivan, Jonathan, and Bettina Renz. 2010. “Chinese Migration: Still the Major Focus of Russian Far East/Chinese North East Relations?” The Pacific Review 23 (2): 261–85.

张成思. 2011. 金融计量学:时间序列分析视角. 1st ed. 1st Ser. 北京: 中国人民大学出版社.