首页   >   新闻   >   文章

数字经济 209 个工具变量汇总
- 2026 -
02/14
15:55
零号员工
发表时间:2026.02.14     作者:老马     来源:马克数据网     阅读:54

本篇来自 微信公众号【马克数据网】,作者老马。

工具变量是一种在统计学和计量经济学中常用的技术,用于处理因果关系研究中的内生性问题。内生性问题通常是由于遗漏变量、双向因果关系或测量误差等原因造成的,这会导致估计结果出现偏误。工具变量的使用可以帮助解决这一问题马克团队收集了CSSCI期刊文本数据,并对”数字经济“相关期刊进行文本分析,统计了215个”数字经济“相关的工具变量,希望对大家提升研究效率有所帮助。

高频变量包括,邮电历史数据、电话机数量、邮局个数、地形坡度及距离、互联网普及(率)、互联网用户(数量)、互联网端口(数量)、互联网投资、数字经济,共计 9 个变量。

低频变量包括,电商销售额、最低工资、光缆密度 等等。

点击阅读原文,查看全部变量。数字经济-215个工具变量汇总

# 工具变量 参考文献
1 1984年百人固定电话数与上年全国互联网用户的交互项 数字经济缓解区域塌陷的影响效应及作用机制研究—基于“本地效应”与“空间效应”的分析
2 互联网普及率、移动电话普及率 数字经济发展与区域环境质量改善—来自省级面板数据的证据
3 1999年城市固定电话使用密度与汇率的乘积 数字经济开放的环境效应研究—基于ICT的进出口数据
... ... ...
215 各城市在1984年的邮电历史数据 数字经济、创业活跃度与高质量发展—来自中国城市的经验证据

上图的横轴是 Jingyi 梳理出来的 9 大工具变量;纵轴是使用这些变量的文献的篇数。不难发现,有关于“数字经济”论文使用的工具变量,用的最多的是“电话机数量”,即研究数字经济时候,学者更加倾向于使用“电话机数量”研究经济变量关系。排名第二和第三的工具变量,分别是“邮局个数”和“互联网用户(数量)”。简单粗暴地理解,这些变量与数字经济息息相关。


图2和图3,是针对 9 个工具变量,将 215 篇文献标题归类,并对标题进行分词,查看文献标题的关键词分布。不难发现,涉及 9 个工具变量的文献标题,出现词频最高的是,“经济”、“数字”、“发展”、“影响”。计算方法,统计一定频度之上的标题关键词,选取若干个(总共 24 个),分别查看在 9 个变量上出现的频数。然后将该频数除以总频数形成“频率”,关键该“频率”再除以每个关键变量上被归类的文献数量,即计算出篇均的关键词出现频率。

在分布上面,图2显示,毫无疑问“经济”和“数字”两大关键词是频率最高的。其次,“发展”一词最多出现在“互联网端口(数量)”项下,即使用“互联网端口(数量)”做研究的论文中,更可能涉及发展。想来“端口”是非常专业的、形容互联网时代的技术名词,更“技术”的文献,更关注“发展”也显得非常合理了。

还有一个标题关键词引起人们注意的,是“影响”。我们发现,工具变量“互联网投资”和工具变量“互联网用户(数量)”项下,标题关键词影响的篇均频率最高。这一结论也是显然的。


第二梯队的标题关键词,明显覆盖到的工具变量就要少很多。其中,工具变量“互联网用户(数量)”和工具变量“电话机数量”,对应的文献标题,更多包含“效应”、“研究”、“创新”、“实证”。针对“效应”一词。这两个工具变量,是一种划时代的通信方式的转变,推断一下,文献中会提出“蝴蝶效应”、“传染病效应”等的概率会很高。当然,涉及“效应”的标题最多的还是使用“数字经济”这个工具变量,想来“数字经济”是一种总结概括的新词汇,自然有一种不言而喻感。换言之,这种统计频率推断出的高概率事件,似乎其因果关系是比较显然的。

这些图来自 Jingyi 个人分析,欢迎读者多出些问题,Jingyi 给大家分析分析!另外,感谢公众号出具的数据。



原文链接

长按/扫码,有您的支持,我们会更加努力!










0


最新评论
TOP 5 精选
回到顶部   回上一级
写文章

最新资讯




直播笔记


热点话题


精品论文


有你的鼓励
ShoelessCai 将更努力





文档免费。保护知识产权,保护创新。