会员专享|1998~2013 年中国工业企业数据库与专利数据库匹配结果数据(大数据预警!7G)

今天给大家分享一份 1998~2013 年的工企业数据库与专利数据库匹配的结果数据(包含工企业数据库的全部数据和一些专利的信息)其中 1998~2009 年的专利数据来源于 Chinese Patent Data Project 网站(https://sites.google.com/site/sipopdb/home/sipo---asie),2010~2013 年的专利数据来源于中国国家知识产权专利局专利数据库。

为了方面大家读取,我把数据拆分成了逐年的,使用 Stata 的 append 命令即可快速合并:

use '1998年工企数据库和专利数据库匹配结果(完整).dta', clear
forval j = 1999/2013{
append using '`j'年工企数据库和专利数据库匹配结果(完整).dta'
}

为了让大家更直观的了解这份数据,这里我汇总统计了下数据中每年的专利情况。作为对比,表的第三列列示了寇宗来&刘学悦(2020)(《经济研究》2020 年 第 3 期)的结果:

年份 本数据中各年专利数量 寇宗来&刘学悦(2020)
1998 9810 9390
1999 14618 12848
2000 17453 15418
2001 21297 19502
2002 31463 28718
2003 38699 35664
2004 51638 48470
2005 64098 60140
2006 87442 83836
2007 110797 106327
2008 132462 150182
2009 186382 185379
2010 204142
2011 311064 362356
2012 439560 487053
2013 486656 533430

对比可以看到,2009 年之前的数量相差不多,2010~2013年,本数据平均每年比寇宗来&刘学悦(2020)使用的数据少 5w 个专利。

另外本数据使用的工企每年包含的工企业数量如下(依然对比寇宗来&刘学悦(2020)使用的):

年份 本数据匹配使用的工企数据中各年工企业数量 寇宗来&刘学悦(2020)
1998 165115 165118
1999 162022 162033
2000 162872 162885
2001 171254 171256
2002 181542 181557
2003 196206 196222
2004 279011 276474
2005 270023 271835
2006 301930 301961
2007 336732 336768
2008 412212 411407
2009 366130 355583
2010 442539
2011 302593 302593
2012 324604 323911
2013 344875 344875

由于1998~2009 年和 2010~2013 年使用的专利数据不太一样,所以包含的变量也不太一样,其中 1998~2009 年的数据中 patent_type 为专利类型,u 表示实用型专利,d 表示设计型专利,i 表示发明型专利;2010~2013 年的数据中 专利类型原有变量中 1 和 8 表示发明型专利,2 和 9 表示实用型专利,3 表示设计型专利。各年三种类型的专利数量变化如下:

包含如下文件,均为 Stata 的 dta 格式数据,合并方法上文已经介绍:

另外需要注意,各年的变量数目不完全相同,因为为了节省存储空间,我在把数据拆分后删除了一些完全缺失的变量。

(0)

相关推荐