2025 年 9 月 30 日于上海财经大学科研实验大楼开展相关工作交流,由中国人民大学教授朱利平讲授相关分析。
笔者基于自己感兴趣的话题作了笔记。
01 如何用数据识别市场有效性?
如果 X(t-1)能够预测 X(t),则市场无效;
如果 X(t-1)不能预测 X(t),则市场有效。
02 2007至2014时间内,双日冕没有粒子加速的原因?
2020 年,由北京大学和美国国家大气研究中心领衔的一支科研团队发展了二维冕震方法,并将其成功应用到日冕多通道偏振仪所观测的普遍性波动中。以前的冕震方法只能获得磁场的一个值、或者一条线上分布,新的二维冕震方法能够获得磁场在一个面上的分布。团队首次绘制出日冕全局性磁场的二维分布图,实现了基于冕震方法测量日冕磁场从“点”、“线”到“面”的飞跃,为实现日冕磁场的常规监测奠定了基础。
这里再补一点基础知识。
测量太阳磁场通过“塞曼效应”实现,使得一条谱线在磁场中分裂成多条波长不同的谱线,然后测量波长差,因而可以获得磁场信息。然而,因日冕磁场较弱,相应波长的差距很小。这个工作,由美国夏威夷的丹尼尔·井上太阳望远镜,科学家成功捕捉到日冕磁场信息的重要手段。借助地面的射电望远镜阵列观测,科学家能够对太阳部分区域进行较准确的日冕磁场分析,诸如耀斑发生区域。从而,监测这些区域的磁场变化。
用自己的话再说一遍。
太阳磁场变动,可以通过波长差来测定,这种“分裂成不同波长”称为“塞曼效应”。日冕波长差很小,很难测,但是是测的出来的。
北大团队的工作贡献是什么?
他们是发明了一种处理数据的方法。简言之,让磁场微变化呈现在面上;换言之,考虑不同磁场之间的相互作用。因此,相关分析就显得很重要了!
注意,这里笔者加了点外部资料,具体怎么做相关分析的,课上没听清,现在听课还是会有些分心的。
03 相关文献
多维的分析,包括主成分分析、典型相关分析。有个科学家 Hotteling 同时致力于这两块研究。
04 变量之间的独立性
用以下公式表示:
05 非线性关系表示
非线性关系 Wassily 1948 年提出:

但是,这个时候就有人提出反例。随机变量 X+Y=1,存在以下情形,即 X=0 时候 Y=1,而 X=1 时候 Y=0。其实,这是一种边际情况,因此对上式进行修正:

该式子可以处理 X+Y=1 的情形。
06 距离关系函数

其中,w(s,t) 是权重。这提醒我们,选择合适的权重非常关键。此前,有科学家提出显性表达式就会使得计算简化,两年时间,就使得细分领域工作向前推进很多。
07 相关系数最大值
雷尼,作为图论科学家,找到相关系数最大值。
08 简化的关系距离
结合上述工作,对关系距离进行简化

朱老师即其学生许同学,对上式进行积分。进一步,开发出“无矩条件”,权重选择很重要,权重表达式尽量简单的话,就能大大降低积分难度。
还有一种做法,已经验证在低维度的时候,随机变量接近标准正态分布,直接应用标准正态是非常简单的。
09 应用
投影相关系数应用。第一,高能粒子加速的分析;第二,海事货运研究 ,例如天津港集装箱的吞吐量;第三,大脑投影的相关数据研究。
参考文献
[1] 光明日报(2024),揭开日冕磁场的神秘面纱 如何实现?有何意义?,央视网,2024
[2] 杨子浩、田晖(2024),为日冕磁场拍大片(科技大观),人民日报,2024