会员专享|1998~2013 年中国工业企业数据库与专利数据库匹配结果数据(大数据预警!7G)
今天给大家分享一份 1998~2013 年的工企业数据库与专利数据库匹配的结果数据(包含工企业数据库的全部数据和一些专利的信息)其中 1998~2009 年的专利数据来源于 Chinese Patent Data Project 网站(https://sites.google.com/site/sipopdb/home/sipo---asie),2010~2013 年的专利数据来源于中国国家知识产权专利局专利数据库。
为了方面大家读取,我把数据拆分成了逐年的,使用 Stata 的 append 命令即可快速合并:
use '1998年工企数据库和专利数据库匹配结果(完整).dta', clear
forval j = 1999/2013{
append using '`j'年工企数据库和专利数据库匹配结果(完整).dta'
}
为了让大家更直观的了解这份数据,这里我汇总统计了下数据中每年的专利情况。作为对比,表的第三列列示了寇宗来&刘学悦(2020)(《经济研究》2020 年 第 3 期)的结果:
年份 | 本数据中各年专利数量 | 寇宗来&刘学悦(2020) |
---|---|---|
1998 | 9810 | 9390 |
1999 | 14618 | 12848 |
2000 | 17453 | 15418 |
2001 | 21297 | 19502 |
2002 | 31463 | 28718 |
2003 | 38699 | 35664 |
2004 | 51638 | 48470 |
2005 | 64098 | 60140 |
2006 | 87442 | 83836 |
2007 | 110797 | 106327 |
2008 | 132462 | 150182 |
2009 | 186382 | 185379 |
2010 | 204142 | 无 |
2011 | 311064 | 362356 |
2012 | 439560 | 487053 |
2013 | 486656 | 533430 |
对比可以看到,2009 年之前的数量相差不多,2010~2013年,本数据平均每年比寇宗来&刘学悦(2020)使用的数据少 5w 个专利。
另外本数据使用的工企每年包含的工企业数量如下(依然对比寇宗来&刘学悦(2020)使用的):
年份 | 本数据匹配使用的工企数据中各年工企业数量 | 寇宗来&刘学悦(2020) |
---|---|---|
1998 | 165115 | 165118 |
1999 | 162022 | 162033 |
2000 | 162872 | 162885 |
2001 | 171254 | 171256 |
2002 | 181542 | 181557 |
2003 | 196206 | 196222 |
2004 | 279011 | 276474 |
2005 | 270023 | 271835 |
2006 | 301930 | 301961 |
2007 | 336732 | 336768 |
2008 | 412212 | 411407 |
2009 | 366130 | 355583 |
2010 | 442539 | 无 |
2011 | 302593 | 302593 |
2012 | 324604 | 323911 |
2013 | 344875 | 344875 |
由于1998~2009 年和 2010~2013 年使用的专利数据不太一样,所以包含的变量也不太一样,其中 1998~2009 年的数据中 patent_type 为专利类型,u 表示实用型专利,d 表示设计型专利,i 表示发明型专利;2010~2013 年的数据中 专利类型原有变量中 1 和 8 表示发明型专利,2 和 9 表示实用型专利,3 表示设计型专利。各年三种类型的专利数量变化如下:

包含如下文件,均为 Stata 的 dta 格式数据,合并方法上文已经介绍:

另外需要注意,各年的变量数目不完全相同,因为为了节省存储空间,我在把数据拆分后删除了一些完全缺失的变量。
赞 (0)