当前位置：首页>python>名师讲堂|使用 Python 测算各城市虚拟集聚程度

名师讲堂|使用 Python 测算各城市虚拟集聚程度

2026-07-02 16:51:22

由于借助 AI 工具学习编程已经变得非常容易了，因此之后的课程就不再默认进行视频讲解了，如果特别需要视频讲解也可以联系李老师预约讲解～讲义材料学习过程中遇到的问题也可以及时与李老师联系。

购买 RStata 名师讲堂会员即可参加该课程啦（之前的和未来的都可以参加）！

价格：2800/年或者 4800/长期

购买会员可以从这里下单：https://rstata.duanshu.com/#/card/list/

名师讲堂会员权益：

参加每个月 3～4 次的名师讲堂课程；
参加平台上的其他 R 语言和 Stata 的课程；
以会员折扣价购买我们分享的数据资料（10 元/份）；
课程内外的提问解答服务（课程外的尽量帮忙解决）。

* 如果发票可添加小编微信 r_stata2 （RStata 李老师）开具。如需数据资料，购买后可添加小编微信免费领取数据折扣卡。

更多关于 RStata 会员的更多信息可添加微信号 r_stata2 咨询：

课程主页（点击文末的阅读原文即可跳转）：https://rstata.duanshu.com/#/brief/course/edab8a934b5f415a9fda38d80a326842

今天给大家分享使用 Python 测算各城市虚拟集聚度的方法。该方法参考自宋林等《虚拟集聚与城市经济韧性》，通过结合区位熵和空间距离权重来综合测度城市的虚拟集聚水平。

附件中提供了该参考文献的 PDF 文件，感兴趣的小伙伴可以阅读原文。

指标来源与计算原理

虚拟集聚度（Virtual Agglomeration）

虚拟集聚度是衡量城市在数字经济领域集聚程度的重要指标。与传统的地理集聚不同，虚拟集聚强调通过信息技术实现的空间联系和资源共享，反映了城市在信息传输、软件和信息技术服务业领域的相对优势。

虚拟集聚度的计算公式为：

区位熵（Location Quotient）

公式中方括号内的部分即为区位熵：

区位熵衡量某城市 IT 行业的专业化程度相对于全国的水平：

区位熵 > 1：该城市 IT 行业集聚度高于全国平均水平
区位熵 = 1：与全国平均水平相当
区位熵 < 1：低于全国平均水平

距离权重

计算步骤概述

整个计算过程分为以下几个步骤：

数据准备：读取新增企业和注销企业数据
存续企业计算：通过累计新增减去累计注销得到各城市各行业的存续企业数
IT 行业筛选：提取"信息传输、软件和信息技术服务业"企业数据
区位熵计算：计算各城市 IT 行业的区位熵
距离矩阵计算：使用 geopandas 计算城市间的地理距离
虚拟集聚度计算：结合区位熵和距离权重计算最终指标
结果保存：输出 CSV 文件

使用 reticulate 创建与管理 Python 虚拟环境

在 R 中通过 reticulate 包来调用 Python，最好的实践是为项目创建一个专属的 Python 虚拟环境，将所需依赖隔离到独立空间，避免与系统 Python（如 Anaconda）发生版本冲突。

重要说明（避免"已初始化"报错）：reticulate 在 R 会话中只能绑定一次 Python——一旦某个 {python} 代码块运行，Python 解释器就被锁定，之后再调用 use_virtualenv() 会报错：
ERROR: The requested version of Python cannot be used, as another version has already been initialized.
因此，虚拟环境的激活必须在所有 {python} 代码块之前完成。本文档的解决方案是在 setup chunk 中通过 Sys.setenv(RETICULATE_PYTHON = ...) 提前锁定 Python 路径，这是 reticulate 选取 Python 的最高优先级入口。