本文是一篇企业管理论文,本研究选取了A股279家人工智能概念股的上市公司为研究样本,以其2006-2022年21583篇论文的面板数据为基础,定义并量化了开放科学、开放协作广度、开放协作深度、互补资产、学术联系、知识积累、战略布局、前沿创新等相关变量,旨在揭示人工智能企业开放科学、先导能力与开放协作间的潜在关系。
一、引言
(一)研究背景及意义
1.研究背景
如今,大模型ChatGPT引起世界热议,自动驾驶、语音交互、物体识别、智慧医疗等AI应用的场景无处不在,其影响力横跨各个行业。人工智能技术被普遍认为是各个行业转型升级的关键所(Brynjolfsson和McAfee,2017;Henke等,2016)[1-2],是科技发展和经济增长的重要引擎(Aghion等,2017;Goralski和Tan,2020)[3-4]。值得注意的是,ChatGPT的研发设计并不是由大学或公共研究机构研发出来的,而是由国际领军企业微软公司旗下的OpenAI所完成。尽管对人工智能的研究在20世纪内主要是由大学来完成,但现在人工智能技术的发展越来越多地由领军科技企业来推动;这些企业投入了巨额资金,建立了大型AI实验室并聘请了该领域的顶尖研究员,许多颠覆性的创新和发明就源于大企业的实验室(Hartmann和Henkel,2020)[5]。这些企业不仅创造基础知识,还通过开放科学的方式向外界分享这些知识。
当前,开放科学已经成为全球创新发展的主流范式(张学文等,2024)[6]。2023年,白宫科学技术政策办公室(OSTP)将当年确定为开放科学年。世界各国纷纷投入开放科学的制度构建与理论研究中,各大企业也纷纷通过开放科学分享知识;2021年联合国教科文组织于发布了《开放科学建议书》,通过了世界首个开放科学国际框架;同年,我国修订了《中华人民共和国科学技术进步法》,明确提出“推动开放科学的发展”。开放科学不仅是提升国家创新效能的关键,也是提升企业科研能力的关键(杨卫等,2023)[7]。世界上90%的行业领先企业都存在知识披露行为(Simeth和Lhuillery,2015)[8],无论是有着独立实验室的大企业还是众多科技型中小企业,无论是在制造业部门还是在其他高科技产业(张学文和陈劲,2013)[9],这都成为了一种新的常态行为(Simeth和Lhuillery,2015;Alexy等,2012;Simeth和Raffo,2013)[8][10-11]。

(二)研究内容及方法
1.研究内容
本研究的核心内容是在文献计量范式下探究我国人工智能企业的开放科学规律,在计量经济与因果推断范式下探究其开放科学对开放协作的影响机制与异质情况。
本研究的研究对象围绕人工智能企业展开。具体研究对象是我国A股市场中279家人工智能概念股的上市公司以及部分国内外的人工智能领军企业。人工智能企业通过其开发科学活动在全球市场中占据了越来越重要的位置,且开放科学作为该行业的一种新兴的创新范式,逐渐成为推动企业技术进步与行业合作的重要力量。
本研究的理论内容以开放科学等相关理论作为理论支撑。开放科学作为一种新的科学研究范式,其核心思想是通过开放数据、共享资源和跨界合作来加速创新和技术进步。开放科学的理论多侧重于学术界、公共机构或科研组织,在企业界的应用尚缺乏充分的理论探讨。本文以人工智能企业的开放科学为研究客体,将开放科学的理论框架与企业创新管理相结合,探究企业在实践中的开放科学行为及其对开放协作的推动作用。
本研究的开放科学具体聚焦于论文发表这一特殊形式。在人工智能领域,论文发表不仅是学术成果的重要体现,也是技术创新与合作交流的核心途径。企业通过公开发表学术论文,不仅能够共享自己的研究成果,还能吸引学术界、产业界以及政府部门的关注与合作。因此,论文发表在此研究中作为衡量开放科学的主要指标。
本研究的实证主题围绕人工智能企业的开放科学如何影响其开放协作展开。包括协作广度与深度两个具体层面。本文还探讨了开放科学在推动协作广度和深度方面的传导机制,构建了战略布局、知识积累和前沿创新这三维的先导能力中介。同样探究了在学术联系与互补资产调节下的影响区别,并对开放科学的异质情况进行分析。
二、文献综述
(一)开放科学理论
1.开放科学文献的可视化概览
为了全面分析开放科学的文献。本研究首先在CNKI和Web of Science的核心合集数据库中使用主题检索,手动搜索了“Open Science、Scientificdisclosure、scientific publication、Open knowledge disclosure、Corporate science、scientific knowledge disclosure、Defensive publishing、firms publish、R&DDisclosure、Open source innovation”等中英文关键词的相关下位词和同义词,进而进行可视化的分析概览。搜索累计获得了近4000篇论文。为了全面掌握开放科学相关的文献信息,本研究使用Citespace软件的相关功能对其3371篇英文论文以1996年至2024年的2年时间切片为基础,以Top50关键词等LLR算法支撑分析,以最小生成树模型精简网络,绘制了多个方面的知识图谱用于计量分析用于该主题的国别、关键词和聚类分析。
另一方面,科技巨头不断推动开放科学实践。2010年代,越来越多的企业与高校和科研机构建立了紧密的合作关系,特别是在人工智能、生命科学等高科技领域。通过与学术界的合作,企业可以共享最新的研究成果和数据,推动自身研发的同时,也加速了整个科研生态系统的进步。这种合作不仅限于资助研究,还包括在开放数据、开源软件等领域的知识披露。随着科技企业与学术界的合作不断加深,研究企业如何通过开放科学和知识披露提升创新能力,成为学术界的一个新兴热点。2013年,谷歌、IBM、微软等科技巨头加大了对基础研究的投资,并积极推动开源项目。这些企业不仅在人工智能和数据科学领域开展前沿研究,还通过开源软件和数据集来实现知识和数据共享。例如,谷歌在2015年正式发布的TensorFlow开源项目,其早期研发始于2013年。微软也在2018年开源了其人工智能工具包,还有Google在人工智能方面一系列里程碑式的开源大模型论文。科技巨头的行动和企业在基础科学中的作用越来越大,促使学术界在2013年和2018年对企业知识披露和开放科学行为的研究日益高涨。
(二)先导能力
1.先导能力的研究现状
先导能力(Pioneering capabilities)作为动态能力的关键组成部分,主要应用在市场营销、战略管理和企业创新领域。Teece等(1997)最早提出,动态能力是企业通过重构、集成和重新配置其资源来应对快速变化的市场环境,从而保持竞争力的一种能力[84]。在此理论框架下,先导能力不仅是指企业在技术创新方面的能力,还涵盖了企业在战略层面识别并利用市场机会的能力。Hernández-Linares等(2024)进一步阐述,先导能力可以帮助企业在快速变化的环境中识别并抢占市场机会,从而形成持续的竞争优势[85]。先导能力在帮助企业快速响应外部市场需求和技术变化方面亦起到了至关重要的作用,尤其是在技术密集型行业中,先导能力为企业提供了应对市场不确定性的灵活性和创新驱动力(Hernández-Linares等,2024)[85]。
先导能力的形成不仅依赖于企业内部的技术资源和创新能力,还与企业的战略取向密切相关。Mueller等(2012)指出,具有强烈先导能力的企业通常会采取积极的市场拓展战略,通过创新性产品的推出在市场中占据领先地位[86]。这种战略不仅帮助企业获得短期的竞争优势,更为企业提供了长期持续创新的能力。Zahra和George(2002)强调先导能力的核心在于企业不断整合内外部资源,尤其是知识资源,进而推动企业创新。企业通过灵活调整战略,优化资源配置,能够在高度竞争的市场中保持竞争力并获得独特的市场地位[87]。
先导能力与企业的创业导向(Entrepreneurial Orientation,EO)密切相关。研究表明,具有较强创业导向的企业往往能够通过更强的创新能力、风险承担和主动性来推动先导能力的形成(Schilke等,2018)[88]。Schilke等(2018)提出,创业导向通过强化企业的创新思维和市场敏感性,帮助企业在技术变革和市场动态变化中占据有利位置,从而增强企业的先导能力[88]。
三、人工智能企业开放科学的演进规律.............................43
(一)年度分布....................................44
(二)企业分布...................................45
四、理论逻辑与假设...................59
(一)开放科学与开放协作广度.......................59
(二)开放科学与开放协作深度............................61
五、开放科学对开放协作的直接效应......................71
(一)研究设计......................71
1.变量与模型...............................71
2.样本数据..................................73
七、因果推断下的效应检验
(一)研究设计
1.双重机器学习
近年来,随着高维数据日益成为实证研究的常态,传统的因果推断方法在变量选择、内生性控制与非线性建模
