H3b:技术成熟度负向调节市场信号对专利被引频次的正向关系。
本文的理论框架如图1所示。
图1 理论模型
资料来源:本文绘制
三、数据、变量与模型构建
1.样本选择
本文选取USPTO数据库中中国授权专利的原因为:第一,考虑到在美国申请专利语言文化差异且费用较高,只有高技术水平并且能够产生与其经济成本相匹配的发明成果才会在美国申请专利,与本文研究主题国际高质量专利相呼应;第二,该数据集包含专利引用关系的数据集以及一系列涉及专利特征的重要信息,使专利质量的实证分析具有可行性与操作性;第三,考虑到近年来中美贸易摩擦不断,其产权纷争则是重点。关注中国在USPTO的专利质量及其影响因素,有助于给中国企业、政府机构等提供参考意见;第四,只有经过严格审查、授权的专利能够体现专利技术的市场价值,受法律保护①。本文从中提取1978—2015年中国专利授权数据进行分析,通过删除控制变量缺失的样本,共得到55634项专利样本参与回归分析。
2.变量与数据
(1)被解释变量。本文的被解释变量为专利的年度被引频次,该指标在一定程度上反映出专利的质量和影响力,即多次被引用的专利在某技术领域上具有基础性、先进性和关键地位,对后续专利具有重要的技术溢出与引导作用。
(2)主要解释变量与调节变量。本文的主要解释变量包括国际专利转让与市场化程度。国际专利转让是一个二值虚拟变量,衡量的是在国际市场中国是否转让了某专利。如果在国际市场中国转让了某专利,则该虚拟变量被赋值为1;否则,则该虚拟变量被赋值为O。已有文献中,市场化指数通常被用来衡量市场化程度(闫珍丽等,2019)[35]。考虑到市场化指数子指标非国有化程度能够很好地衡量市场中企业竞争的激烈程度,更好的传递市场信号,且与其他市场化指数子指标相关系数高达92.24%,本文拟采用此指标来指代市场化程度。此外,在稳健性分析中,本文还采用了市场化总指数替代其子指标重新进行回归。
本文的调节变量包括专利的技术宽度与技术成熟度。专利的技术宽度衡量了专利涉及的技术领域范围,在专利申请书中体现为涉及的CPC分类数量。由专利审查员根据专利文献所涉及的技术主题和领域分配多个国际专利分类号,通过专利CPC分类号的多样性可以识别该专利的跨领域现状。类似地,本文以美国视角出发,专利的技术成熟度指的是专利所对应的CPC分类中美国所授权的专利数量。也就是说,相应CPC分类中美国授权的专利数量越多,该专利分类所代表的技术领域发展越成熟。
(3)控制变量。为了排除其他可能性解释,本文采取了一系列控制变量:1)专利引用与专利授权时间差。随着时间的增长,年代久远的专利在新公布专利引文中的被引次数占比逐渐减少,因此引入“时间性”因子(张欣和马瑞敏,2018)[9]。本文采用专利引用年份与专利授权年份的时间差衡量该指标。2)专利有效性。实际上,面临逐年增加的高额专利维持费,多数专利均由于未按规定缴纳年费而失效,能够准确地反映专利对专利所有权人的潜在价值(付晔等,2009)[36]。如果缴纳专利维持费用则该指标为1,否则为0。3)申请国外优先权。Huang和Li(2019)[15]提出,与先前在中国国内申请的专利相比,直接在USPTO申请的专利的质量水平普遍较高,其原因是这些专利有可能是由跨国公司国际合作进行申请和授权的国际专利。4)专利家族规模。反映了该专利潜在的技术市场和影响范围,以及企业的国际创新能力、战略布局等,其指标为该专利家族所包含的专利总数。5)第一发明人。该指标衡量的是中国是否作为该专利的第一发明人,具有较强的控制权。6)专利所有权者数。专利所有权者数反映了技术发明的复杂程度和创新水平(Huang和Li,2019)[15]。7)与美国专利所有权合作。陈子凤和官建成(2014)[37]指出,跨国专利合作有助于获得他国先进科学技术和方法,激励产出高质量专利。8)专利独立权利要求数与专利独立权利的字数(张欣和马瑞敏,2018)[9]。专利的保护范围主要取决于独立权利要求,其独立权利要求数越多,保护范围越大。9)另外,考虑到产业技术复杂度的不同,本文参考Huang和Li(2019)[15]的做法针对生物化学产业与计算机、信息系统产业分别形成了虚拟变量。如果某专利属于生物化学产业或计算机、信息系统产业,则该两个虚拟变量为1;否则为0。此外,为了控制组织和省份固定效应,本文还计算了组织申请专利总数与省份申请专利总数,以及构建了所属组织是否为企业、个体或政府机构的三个虚拟变量。
表1为被解释变量、主要解释变量、调节变量以及控制变量的描述性统计结果,主要有最大值、最小值、均值以及标准差。进一步地,本文进行了方差膨胀因子检验(VIF),VIF=1.59,小于2,不存在严重的多重共线性。此外,本文借鉴Cui等(2018)[38]的做法,计算了条件数(condition number),并且条件数等于22.41,低于门槛值30,通过了多重共线诊断检验。本文还进行了异方差检验,White's test chi2(185)=778.92,说明存在显著的异方差性。为此,本文所有模型均采用了稳健标准误减弱异方差性带来的问题。
表1 主要变量解释以及描述性统计
变量名称
|
变量符号
|
说明
|
均值
|
标准差
|
最小值
|
最大值
|
年度被引频次
|
citationannual
|
每年专利被其他专利引用的总数
|
4.58
|
13.17
|
0.00
|
851.00
|
国际专利转让
|
assigment__or
|
国际专利转让是否发生
|
0.89
|
0.32
|
0.00
|
1.00
|
市场化程度
|
nber_private
|
市场化指数
|
8.55
|
1.58
|
0.98
|
13.44
|
技术宽度
|
classnum
|
专利所属cpc分类的种类数
|
1.60
|
0.86
|
1.00
|
11.00
|
技术成熟度
|
classnum_US
|
专利所属cpc分类中美国所授权的专利数
|
1.35
|
1.02
|
0.00
|
5.21
|
专利引用与授权时间差
|
year_long
|
专利被引年份减去专利引用年份
|
-0.04
|
1.49
|
-110.00
|
14.00
|
专利有效性
|
patent_fee
|
专利是否因为没有缴纳专利维持费用而过期
|
0.84
|
0.37
|
0.00
|
1.00
|
申请国外优先权
|
country_priorty
|
专利是否在USPTO申请专利时表明此专利已在国内申请
|
0.28
|
0.45
|
0.00
|
1.00
|
专利家族规模
|
patent_family
|
专利所属的专利家族包含的专利数
|
0.64
|
1.17
|
0.00
|
77.00
|
第一发明人
|
inventor_first
|
是否作为中国专利的第一发明人
|
0.31
|
O.46
|
0.00
|
1.00
|
专利所有权者数
|
assigneenum
|
专利所包含的所有权者个数
|
4.23
|
3.56
|
1.00
|
27.00
|
与美国专利所有权合作
|
assigneecoop_US
|
是否与美国共同成为专利所有权者
|
0.38
|
0.49
|
0.00
|
1.00
|
专利独立权利要求数
|
pat_clm_ct
|
专利中独立权利要求数
|
2.38
|
1.48
|
0.00
|
47.00
|
专利独立权利的字数
|
pat_wrd_min
|
专利中独立权利的字数
|
159.83
|
92.84
|
1.00
|
4900.00
|
生物化学产业
|
biochemical
|
专利所属产业是否为生物化学产业
|
0.01
|
0.09
|
0.00
|
1.00
|
计算机与信息系统产业
|
computi_inform
|
专利所属产业是否为计算机科学与信息系统产业
|
0.17
|
0.37
|
0.00
|
1.00
|
组织申请专利总数
|
orgpatentnum
|
专利所属组织共授权的专利数
|
0.75
|
0.84
|
0.00
|
2.23
|
省市申请专利总数
|
citypatentnum
|
专利所属省市共授权的专利数
|
5.38
|
2.92
|
0.00
|
10.27
|
所在组织为企业性质
|
company
|
专利所属组织是否为企业
|
0.13
|
0.34
|
0.00
|
1.00
|
所在组织为个体性质
|
individual
|
专利所属组织是否为个体
|
0.00
|
0.03
|
0.00
|
1.00
|
所在组织为政府性质
|
Government
|
专利所属组织是否为政府机构
|
0.00
|
0.01
|
0.00
|
1.00
|
资料来源:本文整理
3.模型构建
被解释变量专利年度被引频次是一个计数变量,且分布离散,因此不宜采用传统的线性模型进行回归分析。泊松回归作为一种典型的计数回归模型,广泛应用于专利计数及专利引用研究(Mehta等,2009)[39]。然而,泊松回归中期望与方差相等的要求很难实现。与泊松回归模型相比,负二项回归模型能够有效解决过度分散问题,且对估计量的VCE的默认估计非常接近聚类稳健估计,有助于提高估计的有效性。其中,Lee等(2007)[40]借助负二项回归等,根据专利发明人数量、专利家族数量等指标,对专利年度被引频次的影响因素进行实证分析。此外,为了减弱交互项造成的多重共线性问题,本文采用了中心化的作法。模型设定为如下:
Citationannual=β0+β1assignment_or+β2nber_private+β3classnum+β4classnum_US+β5assignment_or×classnum+β6assignment_or×classnum_US+β7nber_privat×classnum+β8nber_privat×classnum_US+β9controls+β10year+β11cpcdummy+μit
其中,controls表示其他一系列控制变量;year表示年份固定效应;cpcdummy表示专利分类的虚拟变量。如果β1、β2、β3、β4的参数估计均为正,则说明市场与技术存在互补关系,即市场与技术对专利被引频次均至关重要;如果β5、β6、β7、β8的参数估计均为负,则说明市场与技术存在竞争关系,即技术削弱市场的信号传递效应。
四、实证分析
1.特征事实
如图2所示,1980—2015年间,世界与中国的专利申请、专利授权数量得到了快速增长。尤其是,2000年加入WTO之后,中国在美国的专利申请、专利授权数量实现了飞跃,成为不可忽略的创新力量之一。如图3所示,不管是中国独撰专利数量,还是中国合作专利数量,均呈现出显著增长趋势,具体包括中国独撰专利数量、中国个体型独撰专利数量、中国合作型独撰专利数量、中国合作专利数量、中国第一发明人合作专利数量、中国非第一发明人合作专利数量。尤其是2000年以来,中国专利的国际合作频次实现了跨越式增长,更加凸显中国海外专利布局的战略性。需要注意的是,图2和图3均表明,中国国际专利数量实现了快速增长。但是,专利数量并不能够准确衡量中国国际专利的专利质量(闵超等,2017)[41]。此外,由于国内“专利泡沫”现象甚嚣尘上,专利质量问题更加受到政府与研究学者的热切关注。
图2 专利申请、授权数量趋势
资料来源:本文绘制
图3 中国国际合作专利趋势
资料来源:本文绘制
另外,本文从USPTO数据库中抽取出中国国际专利转让事件,共计190251项,分布在80个国家或地区,提取排名前15个国家或地区,如表2所示②。首先,不管是作为受让方还是转让方,中国国内(包括中国大陆内、中国大陆与中国台湾、中国大陆与中国香港)的专利转让均处于较高频次,说明中国专利转让倾向于国内进行技术交流与合作。其次,日本、韩国、加拿大、瑞士、英国、新加坡、荷兰等均既是中国国际专利转让的主要受让方,又是主要转让方,意味着双向专利技术流动频繁。最后,美国是中国国际专利转让的转让方,但是并不是主要受让方;而印度是中国国际专利转让的主要受让方,但是不是主要转让方。上述国际专利转让的不同分布,有助于研究专利质量的不同分布。
表2 中国国际专利转让事件分布
序号
|
中国作为受让方
|
中国作为转让方
|
来源国或地区
|
频次(项)
|
年份
|
频次(项)
|
目的国或地区
|
频次(项)
|
年份
|
频次(项)
|
1
|
整体
|
141164
|
整体
|
141164
|
整体
|
190251
|
整体
|
216056
|
2
|
中国大陆
|
60067
|
2015
|
19984
|
中国大陆
|
63760
|
2014
|
26901
|
3
|
日本
|
13755
|
2014
|
19098
|
中国台湾
|
54191
|
2013
|
20960
|
4
|
美国
|
13146
|
2016
|
15030
|
德国
|
19699
|
2012
|
20250
|
5
|
中国台湾
|
11828
|
2012
|
14005
|
英国
|
1740
|
2015
|
17427
|
6
|
韩国
|
7411
|
2013
|
13520
|
韩国
|
13479
|
2011
|
15669
|
7
|
加拿大
|
6455
|
2011
|
12279
|
加拿大
|
10602
|
2016
|
13797
|
8
|
瑞士
|
6290
|
2010
|
9926
|
法国
|
10210
|
2010
|
13479
|
9
|
中国香港
|
3660
|
2009
|
8877
|
中国香港
|
6800
|
2009
|
11380
|
10
|
喀麦隆
|
2358
|
2008
|
7037
|
意大利
|
3314
|
2008
|
9616
|
11
|
德国
|
1073
|
2007
|
5466
|
瑞士
|
2040
|
2017
|
9283
|
12
|
牙买加
|
973
|
2017
|
5364
|
日本
|
1504
|
2007
|
8708
|
13
|
新加坡
|
862
|
2006
|
2542
|
荷兰
|
869
|
2006
|
7358
|
14
|
英国
|
1402
|
2005
|
1900
|
新加坡
|
635
|
2005
|
6185
|
15
|
荷兰
|
393
|
2004
|
1653
|
印度
|
280
|
2004
|
6015
|
资料来源:本文根据USPTO数据统计
进一步,本文通过统计专利授权数量、各专利引用指标以及各省份市场化程度等,得到表3。首先,根据表3的专利授权数量排序可得,广东、北京、上海、浙江与江苏各省份的专利授权数量位列全国前5。其次,根据表3的平均专利被他引用频次③排序可知,平均专利被他引用频次排序顺序与专利授权数量的排序顺序不太一样。主要体现在两方面:一是广东、北京、上海、浙江与江苏各省份的平均专利被他引用频次在所有省份中仍然位列前茅;二是福建、山东、辽宁、河南与重庆各省份的平均专利被他引用频次排序比较靠前,且显然与其自身专利授权数量排序不一致。尤其是辽宁,平均专利被他引用频次为6.92,位列第一。最后,根据表3的市场化程度排序,可以发现平均专利被他引用频次排序与市场化程度的排序既存在一致性,又存在差异性。不仅广东、北京、上海、浙江与江苏的市场化程度排序与平均专利被他引用频次排序较为一致,而且福建、山东、辽宁、河南与重庆的市场化程度排序与平均专利被他引用频次排序也较为一致。虽然以上省份的市场化程度排序与平均专利被他引用频次排序的趋势一致,但是具体排序顺序存在差别。例如,虽然辽宁的市场化程度排序也较高,但是并没有像平均专利被他引用频次排序一样位列第一。