公共数据开放与城市创新:来自中国试点政策的证据

时间:2026年5月15日
来源:Journal of Innovation & Knowledge

编辑推荐:

周平璐 | 司伟 | 王振宇 | 闵璐 兰州大学经济学院;中国甘肃省兰州市城关区天水南路222号,730000 **摘要** 关于公共数据开放的试点政策是推进数字治理和利用数据作为关键生产要素的重要举措,但对其增强城市创新机制的系统研究 masih sangat t

广告
   X   

周平璐 | 司伟 | 王振宇 | 闵璐
兰州大学经济学院;中国甘肃省兰州市城关区天水南路222号,730000

**摘要**
关于公共数据开放的试点政策是推进数字治理和利用数据作为关键生产要素的重要举措,但对其增强城市创新机制的系统研究 masih sangat terbatas。基于2005-2023年中国282个地级城市的面板数据,本研究采用分阶段差异差分模型(DID)来实证分析该政策对城市创新的因果影响,并揭示其背后的机制。研究表明,公共数据开放主要通过三条路径显著提升了城市创新:刺激投资、促进创业活动以及吸引人才。区域间存在差异,这些差异由经济开放度、新型高质量生产力的发展、数字基础设施以及科技财政支出等因素驱动。本研究通过明确数据作为生产要素在城市创新体系中的独特制度作用,丰富了关于公共数据开放与城市创新关系的理论文献。此外,通过创新的研究设计和识别策略,本研究还为政策评估提供了可行的理论和方法论见解,有助于政策制定者有效评估公共数据开放对城市创新成果的影响。

**引言**
作为第五大生产要素,数据已成为推动经济增长的新动力,并成为推动高质量发展和塑造数字经济的核心资源。公共数据的开放为优化市场数据资源配置奠定了基础,在释放数据潜力、促进中国经济高质量发展方面发挥着关键作用。2023年,中国的数据总量达到32.85 ZB,同比增长22.44%。公共数据占其中最大份额,在数据资源的开发与利用中起到基础性和示范性作用(Fang et al., 2023)。政策文件强调,开放公共数据是扩大数据供应规模、提高供应效率、促进数据要素流通的关键步骤。这些文件强调打破公共数据流动的制度障碍、在效率与公平之间取得平衡的重要性。通过这样做,可以充分释放数据作为生产要素的价值,从而促进各部门的决策优化和创新。

**背景**
作为关键举措,公共数据开放试点政策旨在释放数据作为生产要素的潜力并解决数据流通障碍。2012年,中国在上海推出了首个公共数据开放平台。随后在2015年、2016年和2018年,中国发布了一系列政策文件,包括《促进大数据发展行动计划》《政府信息资源共享管理办法》和《公共信息资源开放试点工作方案》。这些文件规范了数字经济、数字政府、数据治理和数据资源等领域的公共数据开放标准,为政策实施和公共数据管理提供了基础保障。截至2024年7月,中国已有243个省级和市级政府建立了公共数据开放平台,平台数量比2023年增加了约8%,显示出持续扩大的趋势(图1)。这一进展为释放数据要素在城市创新和经济发展中的价值奠定了制度和实践基础。

**公共数据的双重属性**
公共数据具有数据属性和公共性的双重特性(Shen & Feng, 2023),因此具有重塑城市创新动态的独特潜力。公共数据的可追溯性、原创性和广泛覆盖范围能够显著降低信息不对称性并降低知识获取的边际成本。此外,公共数据的非竞争性和非排他性使得政府机构、企业和研究机构能够以相对较低的成本获取数据资源(Fang et al., 2023; Jones & Tonetti, 2020)。由于创新活动具有明显的外部性特征,城市创新系统长期面临信息投入不足、知识重组效率低下以及政府与企业互动不足等挑战(Zhu & Zhang, 2024)。扩大公共数据的开放性和可获取性有助于缓解这些挑战,为创新提供更强的资源基础和更好的合作条件。

**研究方法**
本研究利用中国公共数据开放试点政策的分阶段实施过程,将其视为准自然实验,并采用差异差分(DID)方法来分析其对城市创新的因果效应。该设计提供了关于公共数据开放宏观创新影响的稳健实证证据,并有效探讨了其潜在机制,包括降低信息成本、促进数字经济发展和缓解政策不确定性。研究深入探讨了国家主导的数据开放制度作为城市创新驱动力的作用,并为优化数据要素治理和在中国数字化转型过程中更充分释放公共数据价值提供了政策建议。

**文献综述**
随着中国各地逐步实施公共数据开放试点政策,学术界开始从微观和宏观角度评估其实际效果。微观层面来看,公共数据开放可以降低私人借贷风险(Wang et al., 2025)、提升企业数字创新产出(Li et al., 2025)、提高企业服务质量(Ahmadi Zeleti et al., 2016)、刺激私营企业创新(Li et al., 2025)、增加企业投资(Wang et al., 2024; Ye et al., 2025)、促进金融行业发展(Ouyang et al., 2024)以及帮助企业培育新型高质量生产力(Dong et al., 2025)。此外,公共数据开放还促进了跨区域资本流动、吸引新企业进入市场并推动企业升级(Lan et al., 2024; Zheng & He, 2025; Zou et al., 2025)。

宏观层面而言,公共数据开放政策有助于促进区域协调发展(Fang et al., 2023)、提高财政透明度(Liu et al., 2025)、增加就业机会(Liu et al., 2024)、促进城市产业整合(Guo et al., 2026)并优化营商环境(Cai et al., 2024; Ding & Bai, 2025)。尽管这些研究有助于理解公共数据开放的政策效应,但主要集中在其即时效果上,尚未对其长期创新影响进行系统深入分析。

**城市创新水平的测量与影响因素**
关于城市创新水平的研究最初集中在测量方法上。学者们从创新投入(Liu et al., 2021)和创新产出(Wu & Zhang, 2021)的角度进行了探讨。一些研究开发了多指标评估系统,涵盖创新潜力、产出和投入,但主要局限于省级或部分经济发达地区。目前,利用专利及相关数据来衡量城市创新已成为主流方法(Gu et al., 2025; Wang & Deng, 2022; Wang et al., 2025; Wen et al., 2023; Zhang et al., 2022)。进一步研究表明,城市创新水平受政府引导的资金(Zhuang et al., 2025)、省际互联网基础设施的全面发展水平(Han et al., 2019)、金融科技(Li et al., 2024)、城市设施(Bai & Wei, 2024)和数字经济(Li & Wu, 2024; Zhang et al., 2023; Zhao et al., 2024)等因素影响。这些因素大多与政策直接或间接相关,为研究政策对城市创新的影响提供了理论基础。

**公共数据开放与城市创新的关系:研究空白**
尽管大量研究分别探讨了公共数据开放与城市创新之间的关系,但两者之间的系统联系仍不够清晰。现有研究主要强调开放政府数据对创新提案、透明度和社会价值创造的积极影响(Pedersen, 2020)。然而,一个关键的理论矛盾存在:公共数据能否真正提升城市创新能力仍无共识。这种不确定性主要源于三个研究缺口:一是现有研究主要关注微观层面结果(Mergel et al., 2018; Shen & Lin, 2025),如应用开发和创业;二是缺乏对城市整体创新能力变化的系统性研究;三是缺乏有效的识别策略来处理内生性问题(如逆向因果关系和遗漏变量偏差)。

**研究结论**
中国的公共数据资源在规模和覆盖范围方面位居世界前列(Reinsel et al., 2018),但城市创新系统仍存在信息整合、知识重组和政府与企业协调等瓶颈(Cao et al., 2013),这使得相关研究缺口在中国背景下尤为突出。因此,确定公共数据开放是否真正能提升城市创新能力并系统地探讨其机制已成为具有学术意义和现实紧迫性的研究课题。本研究利用公共数据开放政策的分阶段实施过程,通过差异差分方法识别其对城市创新的因果效应,为公共数据开放在宏观创新层面的影响提供了有力证据,并有效探讨了其潜在机制,如降低信息成本、促进数字经济发展和缓解政策不确定性。因此,公共数据应被理解为一种技术资源和一种制度化生产要素,通过政策设计、制度安排和治理机制来定义和分配。主流的创新理论传统上关注内生技术进步或传统投入的重新配置,而对数据的制度嵌入性质关注较少。随着公共数据开放政策的不断推进,数据提供机制及其周围的治理结构已成为塑造创新绩效的关键条件(Wirtz等人,2022年)。仅仅将数据视为扩展要素框架中的另一个输入,不足以解释公共数据开放如何重塑资源配置、激活市场参与者,并通过制度化供给机制转变创新生态系统。因此,通过系统地将公共数据概念化为一种制度化生产要素并明确其影响机制,重构理论框架是至关重要的。

公共数据开放政策的实施可以促进数据元素的共享,并充分利用其潜在价值,在提升城市创新水平方面发挥重要作用。一方面,公共数据的广泛覆盖范围和大量数据量特征可以降低信息搜索和获取的成本(Goldfarb & Tucker, 2019),使创新实体能够更深入地探索数据元素的潜在价值(Vetrò等人,2016)。另一方面,公共数据开放可以为数据元素和知识溢出提供有利的外部环境,产生乘数效应(Chen & Xu, 2024)。基于Cobb–Douglas生产函数模型(Cobb & Douglas, 1928),我们将数据元素识别为企业的重要生产要素,并构建了理论模型。假设一家企业在生产过程中投资了三种要素,即资本(K)、劳动力(L)和公共数据(D)。这三种要素的边际成本分别为rK、rL和rD/(1+Z),从而产生创新产出(Y)。企业的创新产出(Y)可以代表其创新水平。该地区的公共数据开放程度由Z表示,其范围为(0, 1]。由于公共数据本身的公共性质,加上企业会收集数据这一事实,Z不会等于0。然而,如果该地区实施了公共数据开放政策,Z可以等于1。企业获取数据元素的成本与当地是否实施了公共数据开放政策有关。如果没有实施此类政策,企业获取数据的成本为rD;如果实施了,企业获取数据将变得更加容易,成本也会降低。随后,数据元素的成本变为rD/(1+λZ)。为了简化推导,我们取λ=1,数据元素的成本变为rD/(1+Z)。企业的生产效率受到技术水平(A)的影响,反映了生产技术和知识的积累,与数据元素的外生性和技术传播有关,具体表示为A=A0+δZ。然后,企业的创新生产函数可以确定为:

(1) Y = AKαLβ(DZ)γ, (α+β+γ=1, γ>0)

根据微观经济理论,企业的利润函数为:

(2) max Dπ = AKαLβ(DZ)γ − rKK − rLL − (rD/1+Z)D

为了分析企业数据元素的最优使用情况,我们取企业利润函数的一阶条件:

(3) ∂π/∂D = AKαLβγ(DZ)γ − 1Z − (rD/1+Z) = 0

企业数据元素的最优投入可以确定为:

(4) D* = (AKαLβγZγ(1+Z)/rD)^(1/(1−γ)

为了分析公共数据开放政策对企业数据元素使用的影响,我们对D*关于Z求导,得到:

(5) dD*/dZ = 1/(1−γ)(AKαLβγZγ(1+Z)/rD)^(1/(1−γ))*(γ+(1+γ)Z)/Z(1+Z)) > 0

因此,公共数据开放政策将提高企业数据元素的最优使用。

为了分析公共数据开放对企业创新产出影响,我们首先提出完整的生产函数。结合技术水平,生产函数表示为:

(6) Y = (A0+δZ)KαLβ(D*Z)γ

为了分析公共数据开放政策对企业创新水平的影响,我们根据这些政策推导出创新产出,得到以下方程:

(7) dY/dZ = A0KαLβ(γD*γ−1ZγdD*/dZ+γD*γZγ−1)+δKαLβ(γD*γ−1Zγ+1dD*/dZ+(γ+1)D*γZγ) > 0

如果创新产出对公共数据开放政策的导数始终为正,那么这种政策将对企业的创新水平产生积极影响。

我们认为,一个城市的创新水平可以近似表示为企业创新水平的总和:

(8) Ycity = ∑enterprise=1NYenterprise

因此,当政策Z=1时,每个企业的创新产出增加,从而相应提高城市的整体创新产出和其创新水平。此外,数据元素的正面外部性将进一步放大这种效应。总之,公共数据开放政策的实施将提高城市的创新水平。基于这一结论,本研究提出以下假设:

H1 公共数据开放试点政策可以提高城市的创新水平。

公共数据开放对城市创新水平的路径

投资水平、创业活动和人力资源集中度构成了公共数据开放影响城市创新的主要渠道。选择这三个维度是因为它们对应于资本投入、市场活力和人力资本这两个核心创新资源,构成了城市创新系统的基础支柱(Cooke等人,1997)。投资反映了金融资源分配的规模和效率,以及创新活动的资本基础(Hall & Lerner, 2010)。创业活动代表了市场参与者的活力和新组织实体的创造,是机会识别和创新实验的直接指标(Shane & Venkataraman, 2000)。人力资源集中度反映了熟练劳动力的积累和流动性,支撑了知识的创造、传播和重组(Moretti, 2004)。与其他潜在渠道相比,这三个机制提供了更系统、更有理论依据的解释,说明公共数据作为一种制度化生产要素如何通过资源分配、企业形成和知识生成发挥作用。

投资水平通常指城市在研发、技术和工业发展等领域分配的基础设施资本的规模及其利用效率。在这种情况下,公共数据开放试点政策通过改善投资环境间接增强了城市创新能力。首先,试点政策可以扩大可用的数据资源池(Fang等人,2023),减轻信息不对称性,降低制度交易成本,并提高信息资源的匹配效率(Long等人,2025)。这减少了投资不确定性,促进了资本集聚。其次,试点政策有助于政府优化行政职能,提高透明度,并加速新工业园区和创新研发中心的发展(Li & Liu, 2022)。更高的政策透明度和改进的数字基础设施可以吸引技术和创新驱动型企业入驻试点城市,进一步集中投资。由此产生的投资水平增加为城市创新提供了坚实的资本支持,促进了城市整体创新能力的提升。因此,提出以下假设:

H2 公共数据开放试点政策通过投资水平路径影响城市创新。

创业活动通常通过一个城市中新成立企业的数量来衡量。在这种情况下,公共数据开放试点政策通过促进创业活动间接提升城市创新水平。首先,试点政策可以减少信息不对称性(Huang & Yu, 2023)和企业创新相关的不确定性(Cai & Ma, 2021; Shen & Lin, 2025),使企业家能够更快地识别和抓住市场机会,从而增加新企业的数量。其次,公共数据开放平台释放数据红利,降低研发和市场探索的成本,进一步激发创业活力。创业活动的增加吸引了更多高质量的创新资源来到城市,促进了更活跃的创新文化,有助于创新成果的转化和传播。最终提高了城市的整体创新水平。因此,提出以下假设:

H3 公共数据开放试点政策通过创业活动路径影响城市创新。

人力资源集中度指的是高技能和创新人才在特定区域的空间聚集。在这种情况下,公共数据开放试点政策通过促进人力资源集中效应间接提升城市创新水平。首先,公共数据开放平台的发展有助于培育新兴的数字产业生态系统,刺激就业并吸引专业人才流动(Huang & Yu, 2023),增加了城市创新人力资本的储备。其次,公共数据开放试点城市通常具有更开放、公平和自由的社会氛围(Du, 2020),为高技能个体的职业发展和创新实践提供了有利的环境。人才集中促进了专门知识和创新资源的聚集,进一步通过释放数据的潜在价值并将其作为生产要素来增强城市创新能力。因此,提出以下假设:

H4 公共数据开放试点政策通过人力资源集中路径影响城市创新。

图2显示了本研究的理论框架。

方法论和材料

方法论

基准回归模型规范

Bai等人(2022)和Zhang等人(2023)将各城市推出公共数据开放平台视为准自然实验,并采用分阶段DID模型来评估其对城市创新水平的影响。具体来说,推出平台的城市被指定为处理组,而没有推出平台的城市作为对照组。通过控制城市和时间的固定效应,该模型分析了政策实施前后城市创新水平的差异,以确定政策的因果效应。此外,本研究还包括了稳健性测试,包括平行趋势测试、动态效应分析、结合DID的倾向得分匹配(PSM–DID)和工具变量方法,以确保研究结果的可靠性。研究逻辑可以总结如下:公共数据开放平台的推出引发了投资、创业和人才资源的变化,从而推动了城市创新水平的提高,并系统地检验了政策的效应及其传递机制。

采用分阶段DID模型的三个主要原因如下。首先,公共数据开放平台的推出时间在不同城市之间存在显著差异。这种政策冲击的分阶段特性及其随时间的外生性和阶段性特征为DID方法提供了必要的识别条件。其次,通过将处理组与对照组进行比较,并控制城市和时间的固定效应,该方法可以有效缓解与政策相关的内生性问题,例如城市在数字治理能力、经济基础和创新环境方面的不可观察差异。第三,与简单的横截面或前后对比分析相比,DID方法更清晰地捕捉了政策冲击前后的动态变化。DID方法通过多种稳健性检验(例如PSM–DID和Goodman–Bacon分解)解决了由于处理时间差异和处理效果异质性引起的问题,增强了因果推断的可靠性。此外,模型设计还考虑了潜在的同时期政策干扰和测量误差,确保了结果的稳健性和可解释性。

总之,基于并充分利用现有研究,本研究采用了分阶段DID模型,并在整个分析过程中系统地评估了其基本假设和潜在限制。这种方法旨在确保全面的研究设计和审慎的推断,从而保证实证结果的稳健性和可靠性。因此,推出公共数据开放平台的城市被指定为处理组,其余城市构成对照组。分阶段DID模型用于实证测试,具体回归模型如下:

(9) Ur_Innovationit = α+βOpenit + γControliVarit + δi + δt + εit

下标i代表城市,t代表年份。Ur_Innovationit代表第t年城市i的创新水平,Openit表示在公共数据开放平台上线 的虚拟变量。如果城市i在第t年在公共数据开放平台上线,则取1;否则取0。Control_Varit是控制变量集合,δi代表城市固定效应,δt代表年份的固定效应,εit是随机干扰项。考虑到同一城市内样本的随机扰动项可能存在相关性,本研究在城市层面对标准混淆进行了聚类。α是常数项,β是回归系数;总体而言,它们反映了公共数据透明度对中国城市创新的影响。

在本研究的背景下,使用分阶段差分-in-time(DID)模型需要满足平行趋势假设。该假设认为,在政策干预之前,处理组和对照组遵循相同的趋势。换句话说,没有公共数据开放平台的城市(对照组)的创新水平变化,可以代表如果这些城市启动了此类平台(处理组)的创新水平变化情况。为了减轻实践中处理样本分布不均可能带来的偏差,本研究采用了Bai等人(2022年)和Zheng与He(2025年)的方法,采用了事件研究框架。具体来说,将-4年之前的时期重新编码为-4年,将-1年指定为基期。估计模型如下:

En_Innovationit = α + ∑N=-4N=3βNTreatitN + δControl_Varit + Cityi + Yeart + εit

TreatN代表“上公共数据开放平台”这一事件的虚拟变量,时间虚拟变量N代表每个城市在建立为试点城市之前的n年、当年以及之后的n年内的观察值。具体而言,当N = -1时,表示公共数据开放平台启动的前一年;换句话说,Treat-1=1。其他非试点城市的虚拟变量均设为0。

基于前述的理论分析,本研究认为公共数据开放试点政策主要通过增加投资、促进创业活动以及推动人力资源集中来提升城市创新。为了通过实证检验政策如何影响中国城市的创新,本研究采用了Jiang(2022年)的方法论框架来分析机制和传导渠道,并构建了以下中介效应模型:

Betw_Varit = α + θOpenit + γControl_Varit + δi + δt + εit

Betw_Varit代表机制变量,分别用于捕捉投资水平(Invest_level)、创业活动水平(Entr_activity)和人力资源集聚效应(Hu_capital)。其他变量与之前的文本一致。如果系数θ和ω显著且符合预期,这一结果表明机制变量成立,机制测试得到验证。

本文的解释变量是城市创新水平(Ur_Innovation),解释变量是公共数据开放政策(Open),控制变量包括经济发展水平、第二产业增加值、城市总人口、城市化率和高等教育水平,共计五个。

(1)城市创新水平(Ur_Innovation)。参考Jin等人(2019年)、Li与Zheng(2016年)、Zhao等人(2020年)和Wang等人(2023年)的研究,城市创新水平通过专利授权数量来衡量。与专利申请相比,专利授权审查过程更为精确,更能代表经过验证的有效创新产出水平。

(2)公共数据开放政策(Open)。参考Liu等人(2024年)、Pan等人(2023年)和Zhao与Hao(2023年)的研究,将公共数据开放试点政策视为准自然实验,并使用城市类型虚拟变量与政策实施时间虚拟变量之间的交互项(Group×Post)来表示公共数据开放政策的处理效应。具体来说,在本研究中,公开推出公共数据平台的试点城市Group设为1作为实验组,其余城市设为0作为对照组。将时间虚拟变量Post分别设置为0和1,分别对应政策实施之前和之后。由于城市公共数据开放平台的推出是在2012年至2023年间分批进行的,因此不同城市的开放时间虚拟变量并不一致。

(3)控制变量(Control_Var)。选择依据是Zheng与He(2025年)和Bai等人(2022年)的研究。具体来说,经济发展水平(lnGDP)通过国内生产总值的自然对数来衡量。第二产业增加值(lnAdd)通过第二产业增加值的自然对数来衡量。城市总人口(lnpeople)表示为城市登记人口的对数。借鉴Tang等人(2022年)的研究,城市化率(ubr)主要通过U/(U+R)来衡量,其中U和R分别表示城市和农村常住人口。作为稳健性检验,我们还使用了N/P,即非农业人口(N)与年末总人口(P)的比率。高等教育水平(edu)通过正规高等教育机构数量来表示。

本研究选取了2005年至2023年间中国的282个地级市作为研究样本。由于行政区域调整而在2011年后建立的城市(如贵州省的毕节市和铜仁市),以及数据严重不足的城市(如拉萨市、丹州市和三沙市)被排除在外,以尽可能构建一个平衡的面板数据集。当地政府公共数据开放平台的推出日期是根据复旦大学数字与移动治理实验室发布的《中国政府数据开放报告》和现有文献(Liu等人,2024年;Pan等人,2023年;Zhao与Hao,2023年)确定的。

城市级统计数据来源于《中国城市统计年鉴》和国家知识产权局。对于个别样本的缺失值,通过查阅地方统计年鉴和公报或应用线性插值进行处理。

变量定义和描述性统计数据显示在表1中。

表1. 变量定义和描述性统计

变量名称 变量定义
Observations 均值 中位数 标准差 最小值 最大值
Ur_Innovation 城市创新水平 5,358 0.089 80.008 0.395 30.000 10.7884
Open 公共数据开放试点政策 5,358 0.134 0.000 0.340 70.000 1.0000
lnGDPE 经济发展水平 5,358 16.354 716.327 1.054 713.014 19.8154
lnAdd 第二产业增加值 5,358 15.520 915.531 1.109 811.030 78.5578
lnpeople 城市总人口 5,358 5.891 95.932 10.682 12.846 18.1502
Ubr 城市化率 5,358 0.531 30.516 30.171 70.114 11.3551
Edu 高等教育水平 5,358 8.520 03.000 14.409 50.000 93.0000

表2报告了公共数据开放政策对城市创新水平影响的回归结果。第(1)列显示了在控制城市和年份固定效应的情况下,公共数据开放政策对城市创新的估计效果。Open的系数为正,并在1%的水平上具有统计显著性。第(2)至(6)列依次将控制变量添加到第(1)列的模型中。在所有模型中,Open的系数在1%的水平上仍然显著为正,一致表明公共数据开放政策与城市创新水平之间存在积极关系,支持了假设H1。理论上,受到公共数据开放政策的推动,试点城市可以显著改善信息获取环境,降低制度交易成本,使资本、创业活动和高技能人才更有效地流入创新密集型领域。具体来说,该政策提高了投资决策的精确度和创业项目的可行性,增强了人力资本和专门知识的集聚效应,从而提升了整体城市创新产出。

结果表明,在政策实施之前的TreatN的估计系数不显著且幅度较小,表明处理组和控制组城市创新水平的变化趋势没有显著差异。然而,在公共数据开放平台推出后,TreatN的估计系数显著为正,表明政策干预后实验组和控制组城市创新水平的变化趋势存在显著差异,平行趋势测试得到验证。此外,TreatN的估计系数持续增加,表明公共数据开放平台的试点政策对中国城市创新水平的影响逐渐增强;换句话说,促进效应正在逐步释放。

尽管本研究在准自然实验框架中控制了各种城市特征变量,但由于未观测到的城市特征,公共数据开放政策与城市创新水平之间的观察到的相关性可能是虚假的。根据Fang等人(2023年)、Zheng与He(2025年)和Bai等人(2022年)的研究,进行了安慰剂测试以验证研究结果是由公共数据开放平台的实际推出所驱动的,而非随机因素。具体来说,使用Stata为这282个样本城市随机生成了一个伪处理组虚拟变量Grouprandom和一个伪政策冲击虚拟变量Postrandom。然后模拟了500次随机冲击下的虚构公共数据开放试点政策。每次迭代中,随机选择195个城市作为处理组,并随机分配政策实施时间。图4显示了这些安慰剂测试中估计系数的核密度分布及其对应的p值。随机政策的系数以0为中心,其幅度显著小于真实估计系数(0.0904)。此外,公共数据开放政策对中国城市创新水平的影响并未受到未观测到城市特征的干扰,从而确认了定量评估的有效性。

为了缓解样本选择偏差导致的内生性问题,本研究参考了Yu等人(2022年)和Liang等人(2023年)的研究,采用了1:1匹配方法,并使用了最近邻校准(不进行回放)。具体来说,本研究将所有控制变量(Xia等人,2024年)作为匹配的协变量,受政策影响的实验组作为因变量进行“一对一、无反馈”的最近邻匹配。图5显示,匹配前后结果均不能拒绝处理组和对照组之间没有系统性差异的零假设。图6显示,处理组和对照组在倾向得分范围内的重叠足够显著,满足了共同支持假设。图7显示,匹配后两组样本的分布更加相似,表明PSM有效提高了样本的可比性。表4第(1)列的匹配估计结果显示,Open的回归系数在1%的水平上显著为正,进一步表明本研究的结论是稳健的。

在分阶段DID模型的估计过程中,双向固定效应(TWFE)估计量相当于样本内所有可能的两期DID估计量的加权平均值。这种方法可能导致非稳健性问题,甚至可能出现负权重(Goodman-Bacon,2021年)。根据Baker等人(2022年)和Dai与Zhao(2024年)的研究,本研究进行了Bacon分解。该程序计算每个不同DID比较组的系数和权重,以检查TWFE分阶段DID估计中的潜在偏差。从图8可以看出,“不良处理组”的比例很小,表明公共数据开放试点政策对中国城市创新水平的影响并非由这种类型的比较所驱动。表3显示,本文中的总体双重差分(DID)估计主要来源于对照组包含从未接受过处理的单元的比较,这些单元占了71.1%的高权重。相比之下,可能引入偏见的分组(即使用早期接受处理的单元作为后期处理单元的对照组)的权重仅为5.3%,其DID估计值为负数。总之,本研究的核心发现相对稳健,分阶段的DID估计结果也是可靠的。下载:下载高分辨率图片(241KB);下载完整大小的图片。图8. Goodman–Bacon的多点差异-in-differences分解。表3. Goodman–Bacon分解结果。对照组类型 权重 估计值 已处理与未处理 0.711 30.198 早期处理与后期处理 0.235 40.2259 后期处理与早期处理个体 0.053 3 −0.5479 加权DID估计值 0.1648。

(由于文本较长,部分内容在翻译时进行了简化处理,以确保信息的连贯性和简洁性。)R20.65680.67780.64660.6589
注意:括号内的数值代表稳健标准误差,“***”和“*”分别表示1%和10%的水平下具有显著性。

**科学与技术财政支出的异质性**
大量的科学与技术财政支出为城市创新奠定了基础,并为城市提供了高素质的科技劳动力。因此,公共数据开放试点政策对城市创新的影响可能因此类财政支出的强度而有所不同。根据李(2024年)和张与罗(2024年)的研究,本研究将科学与技术财政支出定义为2024年地级市政府在科学与技术方面的支出与其总预算支出的比率。然后根据中位数值将样本分为高支出组和低支出组,以进行异质性分析。结果列在表8的第(3)和(4)列中。两组系数均为正数,并在1%的水平上具有显著性。然而,高支出组的系数为0.1296,明显高于低支出组的0.0088;这表明该政策对科技财政支出较高的城市的创新促进作用更为显著。可能的原因是更高的财政支出能够迅速吸引创新要素(如创新资本和人才)的集聚。此外,这些要素的有效集中可以放大知识溢出的积极效应(Meng & Wu, 2025),进一步发挥公共数据开放试点政策在提升城市创新水平中的作用。

**结论与讨论**
基于2005年至2023年中国282个地级城市的面板数据,本研究采用分阶段DID模型实证检验了公共数据开放试点政策对城市创新水平的影响。研究发现该政策显著提升了城市创新能力,这一结论在多次稳健性检验中均得到验证,表明该政策在促进创新方面具有可靠的积极作用。此外,该政策通过多种途径发挥作用,主要体现在增加投资水平、推动创业活动和集中人力资源方面。因此,该政策直接作用于创新产出,并通过改善创新生态系统的关键方面间接促进城市创新。同时,政策效果存在显著异质性。地区经济开放度、新质量生产力的水平、数字基础设施发展以及科学与技术财政支出的规模等因素导致了该政策对不同地区城市创新影响的差异。总之,公共数据开放试点政策总体上对提升城市创新水平具有积极效应;但其有效性受到地区条件和资源禀赋的影响,这强调了政策设计需要根据区域差异进行定制,以实现更有针对性的创新激励。

**理论意义**
公共数据开放试点政策通过三个相互关联的机制促进城市创新:增加投资、增强创业活动以及提高人力资源集中度。从理论上讲,这些发现将关于数据开放的微观层面研究纳入了城市创新系统和数字经济发展的更广泛框架中(Harrison et al., 2012; Mergel et al., 2018)。因此,公共数据被视为一种生产要素,通过系统渠道作用于城市层面的要素配置。首先,公共数据开放减少了信息不对称性和交易成本,改善了投资环境,并将资本导向创新密集型领域,从而加强了透明性与资本配置效率之间的联系(Huang & Yu, 2023)。其次,可获取的数据降低了机会识别和实验的不确定性,刺激了创业活动,并明确了其在机构数据供给与创新成果之间的传递作用(Cai & Ma, 2021; Chan, 2013)。第三,更高的制度透明度提高了城市对熟练劳动力的吸引力,促进了人力资本集聚和知识积累(Du, 2020)。总体而言,公共数据开放通过重构资本、创业活动和人才动员与协调的制度条件,重塑了城市创新格局。

**政策建议**
首先,为充分发挥公共数据开放在促进城市创新中的制度作用,政策实施应优先提高数据质量并加强治理。高质量、标准化和可靠的公共数据是激活投资、创业和人才机制的基础。关键措施包括建立统一的数据标准、改进跨部门数据共享以及为开放数据平台实施绩效评估系统。其次,应战略性地扩大试点举措的范围。在数字基础设施先进和经济开放度高的城市,应增加数据开放的广度和深度;在欠发达地区,则应重点改进数据收集、治理和管理体系,以增强创新能力并支持平衡的区域发展。第三,公共数据开放应与其他针对投资、创业和人力资源的政策相协调。通过提供可获取的高质量数据,可以降低信息获取成本,提高投资和创业决策的效率,从而形成这些创新驱动因素之间的良性循环。最后,基础设施不完善的地区应加强财政和技术支持,将科学与技术支出专门用于公共数据治理、平台运营和应用开发,这有助于数据与研究及产业的深度融合,增强公共数据对城市创新的制度效应和乘数效应。

**研究局限性与未来方向**
本研究系统分析了公共数据开放试点政策对城市创新水平的影响,并探讨了投资水平、创业活动和人力资源集中度的中介机制。然而也存在一些局限性:首先,公共数据选择性开放的问题尚未得到充分解决,政府通常只发布被认为安全且不敏感的数据,而真正高价值的微观数据仍大部分不对公众开放;其次,数据粒度相对粗糙,大部分公开数据高度汇总,这限制了对创新活动的精确测量,可能导致对政策真实效果的低估;三是本研究采用传统的指标(如专利数量)来衡量城市创新水平,虽然专利数据主要反映正式技术创新,但未能全面覆盖社会创新、服务创新和数字创新等多元创新活动;最后,分析基于中国试点经验的单一国家背景,其方法论适用性可能受到特定国家背景的限制。各国政策实施速度、数据开放程度和市场响应机制的差异要求在将研究结论推广到其他制度或区域背景时需谨慎。

**未来研究方向**
为进一步研究开放公共数据对城市创新的影响,未来研究应关注三个主要方向:首先,需要构建更精细的公共数据评估指标体系,重点关注数据量、重要性和更新及时性,结合文本分析和案例研究建立“数据价值密度”等指标以提高政策效果测量的精度;其次,可通过区分增量创新和颠覆性创新来多维度分析城市创新成果;此外,结合空间计量模型研究知识溢出和城市间的竞争效应;最后,应开展跨国比较研究,选择制度或经济发展水平相似但数据开放模式不同的国家(如中国和新加坡),以评估该政策的适用性和普遍性。这些研究将丰富关于数据治理和数字经济下城市创新的理论基础和实践指导。

生物通微信公众号
微信
新浪微博


生物通 版权所有