摘要:技术的进步是煤炭行业实现能源清洁高效利用的关键,为了更好地分析当前我国洁净煤技术的整体现状和研发方向,本研究借助专利数据,利用专利计量法从申请趋势、来源机构、地域分布层面对我国洁净煤技术的研发现状进行分析;同时结合文本分析方法,对专利文本关键词进行共现分析,并建立LDA主题模型以挖掘洁净煤技术研发的热点方向。研究发现:我国洁净煤技术专利申请呈上升趋势;来源机构以行业龙头企业居多;除东部发达省份外,一些中西部省份和东北地区的相关技术研发也较为活跃;研发热点集中在煤制油技术、清洁能源制备、废水处理、循环发电、分级转化、烟气除硫。最后从深化煤炭领域产学研合作、加强省份之间跨地域合作、优化热点技术的专利研发布局等方面为我国洁净煤技术的发展提出建议。
关键词:洁净煤技术,专利计量,文本分析,研发现状,技术热点
基金项目:国家社科基金重点项目(22AZD107)
0 引言
长期以来,煤炭在我国能源的生产和消费中占据主体地位,支撑着我国国民经济的发展。然而煤炭的开发利用引起的环境污染问题与生态文明建设之间的矛盾却一直存在,如何在有效保障能源安全供应的前提下实现碳达峰和碳中和的目标,成为当前煤炭领域科研工作的重点。国家发展和改革委员会在2021年10月印发《“十四五”全国清洁生产推行方案》,要求煤炭行业创新清洁生产模式,积极实施清洁生产改造[1]。国务院也在2022年1月印发《“十四五”节能减排综合工作方案》,要求积极推动煤炭行业实现绿色转型[2]。在此基础上,煤炭的清洁高效利用成为我国煤炭行业转型发展的重要方式,对实现双碳目标具有重要意义[3]。
洁净煤技术是煤炭开发利用过程中的加工、燃烧、转化等技术[4],其发展应用直接关系到我国煤炭资源的可持续利用和能源安全战略的实施[5]。已有文献对洁净煤技术的研究主要集中在以下3大类:一是对洁净煤技术的不同技术路径和机理开展的相关研究。如刘峰等对煤炭安全区间进行分析,探索我国煤炭绿色转型升级的路径,并提出了煤炭清洁低碳利用的创新科技任务[6];帅永等梳理了洁净煤发电技术,为燃煤清洁发电指明发展方向[7];王芳等总结了煤定向热解调控的措施,可有效降低煤油中的含尘量[8];张文等构建了煤化工废水处理系统的技术框架,并为当前存在的技术瓶颈提供解决思路[9]。二是结合区域特征对洁净煤技术的应用进行的对策建议研究。如张保留等以太原市为例,根据其工业结构特点和煤炭清洁利用程度提出转型发展建议[10];王迪等探索了长三角地区工业煤炭清洁利用的减排效应,并提出针对性建议[11]。三是分析不同清洁技术对环境产生的经济影响。如陈茜等将宏观经济与微观技术相结合,分析了洁净煤电技术产生的社会经济影响[12];柴瑞瑞等研究了煤电企业使用清洁技术转型后带来的成本与环境效益[13]。可以看出,已有文献对洁净煤技术的分析多集中于路径机理和影响应用,对洁净煤技术研发的方向和整体现状尚未做统一的梳理。
专利是技术发明的载体,任何技术的发展都离不开专利的支撑。专利代表着一个行业的技术创新状况,是一个企业甚至国家核心竞争力的重要战略资源。专利中包含的与发明创造有关的重要技术信息可以为研发人员提供参考依据,同时识别出来的研究热点也可以帮助企业等科研机构确定技术研发方向,提高研发效率[14]。因而学者们多利用专利数据来对其关注的技术领域进行综合分析,如刘建明等采用计量方法分析了区块链技术的专利技术发展状况,并利用社会网络方法分析其关键技术[15];方曦等结合技术生命周期和Logistic模型,利用专利数据对新能源汽车充电桩技术的生命周期进行预测[16]。然而在煤炭领域借助专利数据来分析相关技术的研究却比较少,仅有的如刘东霞等利用专利数据揭示了煤液化技术的研发特征和影响因素[17];王江等提出技术群组的概念,并利用计量统计对煤化工专利技术进行分类[18]。
综上可知,在对专利数据的研究中,学者们多采用计量的方法,较少有学者结合文本分析机器学习等方法来挖掘研究热点,陈欣然等也认为结合专利关键词的文本分析方法可以帮助后续研究提高前沿领域识别的准确度,同时目前尚未有学者从专利的角度对洁净煤技术的发展进行综合分析[19]。因此,文中将结合计量统计和文本分析2种方法,对我国洁净煤技术的专利申请现状和领域研究热点进行分析,以期帮助相关决策者制定研究计划,提高研究效率,促进我国洁净煤技术的发展。
1 数据来源与研究方法
1.1 数据来源
文中数据来源于国家知识产权局(CNIPA)提供的专利检索数据库,CNIPA是国家市场监督管理总局管理的国家权威机构,其专利数据库涵盖了自1985年以来我国所有的专利数据,检索功能完善,可以满足基本的检索需要。数据检索过程中以“洁净煤/煤清洁/煤净化”等为专利名称或摘要的关键词,由于2000年之前洁净煤技术领域的专利申请数量均小于20件,为使统计结果更清晰,文中数据的检索时间跨度为2000年1月1日至2020年12月31日,最终检索到7 754条专利数据。
1.2 研究方法
本研究主要采用专利计量和专利文本分析相结合的方法,即先利用计量统计分析洁净煤技术的专利申请现状,包括专利申请趋势、专利来源机构、专利地域分布。接下来利用文本分析方法提取专利研发的技术热点,首先对专利文本进行分词和预处理,其次利用Bibexcel软件构建关键词共现矩阵,并用Netdraw绘制关键词的社会网络关系图,最后对关键词进行LDA(Latent Dirichlet Allocation)主题建模,提取专利文本的热点主题,并绘制pyLDAvis可视化图判断各主题所占比例。具体流程如图1所示。

涉及到的主要方法是专利计量与文本分析。专利计量是综合数学与统计学的方法对专利数据进行分析的方法,并往往采用图表的形式使统计结果更直观化。而专利文本分析主要是在文本预处理和关键词分析的基础上进行LDA主题建模。LDA是目前机器学习领域常见的三层贝叶斯概率主题模型,也被称作狄利克雷分布,用于从大量文本数据集中分析和提取潜在主题[20],每个主题都用单词的概率分布来表示,在文本相似度的处理上具有独到的优势[21]。对于某条专利文本,首先以一定概率生成该专利文本的一个主题分布,然后从上述被抽到的主题中生成对应的词分布,再根据主题中的词分布随机选取一个词,重复上述过程直至生成完整的主题[22]。令洁净煤技术的专利名称组成整个文本集D,其中某条专利文本d由n个关键词组成,这些词语具体表示为w=(w1,w2,…,wn),并假设评论集D中含有k个隐含的主题,则LDA主题提取的具体步骤为
(1)抽取专利文本d在主题上的概率分布θi,其中d∈{1,2,…,D},即θd~Dirichlet(α),θd为第d个专利文本的主题概率分布;α为每个专利文本下主题的多项分布的Dirichlet先验参数。
(2)从主题的多项式分布θi中取样生成专利文本di第j个词的主题zi,j。
(3)抽取主题zi,j对应的特征词分布
,,即
~Dirichlet(β),β为每个主题下的词多项分布的Dirichlet先验参数。
(4)从词语的多项式分布
中采样最终生成词语wi,j。
2 专利申请现状分析
2.1 专利申请趋势
图2是我国洁净煤技术2000—2020年的申请数量变化趋势,从图2中可以看出,我国洁净煤技术的专利申请总体呈现上升趋势,其技术发展的生命周期大致可划分2个阶段:2000—2007年是发展的萌芽期,该阶段洁净煤技术的专利申请仍处在初步探索的发展阶段;2007年之后洁净煤技术开始进入快速发展期,专利申请数量有较为明显的上升趋势,特别是在2012年实现35%的最高增长率,2019年达到顶峰990件,得益于此期间政府出台的一系列能源转型创新政策,扶持煤炭清洁利用技术的发展。但在2020年申请数量却有所下降,其原因可能是由于新冠疫情导致的科研外部环境不稳定,以及国家知识产权局出台的严格的专利审查制度。从总体趋势来看,目前洁净煤技术的专利申请仍处于快速发展期,并有望在双碳目标的激励下继续增长。

2.2 专利来源机构
通过对专利申请的来源机构进行分析,可以从总体上获知该领域参与研发的市场主体和研发实力。我国洁净煤技术专利来源机构前10位见表1。从表1中可以看出,前10位中企业占9席,高校科研机构仅占1席。这反映出在洁净煤技术的研发过程中,一些生产经营单位在行业政策的支持下表现出较强的专利研发实力,而高校等非生产经营单位可能往往倾向于理论尖端探索,专利申请成果相对较少。图3的气泡图展示了这10个机构在近5年所申请的洁净煤技术相关专利的变化趋势,从中可以发现中冶焦耐、中国华能集团、中国石油化工在近几年始终对洁净煤技术保持着较高水平的关注,神华集团的子公司神华煤制油与太原理工大学也维持着较为稳定的研发水平,北京神雾公司对洁净煤技术的关注在近年来呈现逐年上升的趋势。


2.3 专利地域分布
表2列举了我国洁净煤技术专利申请数量排前10位的省(市),参考国家统计局对东部、西部、中部、东北地区的划分标准可以发现,洁净煤技术专利申请前10位中有6个东部省份、1个西部省份(陕西省)、2个中部省份(山西省、湖北省)以及1个东北地区(辽宁省),其中除经济发达的东部地区外,中部的山西省与西部的陕西省作为产煤大省,对洁净煤技术的专利研发也维持在较高水平。图4的气泡图展示了前10个省份在近5年的洁净煤技术相关专利申请数量变化趋势,从中可以大致推断出东北地区的辽宁省,中部的山西省、陕西省以及东部的江苏省、上海市、河北省近些年在洁净煤相关技术方面的研发投入有所增加,其专利申请数量总体呈上升趋势。


3 专利技术热点分析
3.1 文本分词及预处理
本部分的主要目的是采用文本分析的方法提取洁净煤技术专利研发的热点主题,数据处理对象是7 754条专利数据的专利名称文本。在分析之前需要对文本进行分词和预处理,具体步骤是首先使用Python的Pandas库读取文本信息,执行去重、去乱码、繁转简等操作,其次运用Jieba库对专利文本数据进行分词,过滤掉停用词并计算词频,最终选取出现频率最高的前300个词作为关键词,以此为基础进行后续的文本分析。
3.2 关键词共现网络分析
共现矩阵用来统计2个词向量在文本数据中共同出现的次数,可以表示词向量之间的相近关系[23]。通过构建洁净煤技术专利文本关键词的共现矩阵,从而可以从关键词之间的相关关系判断专利技术领域之间的重叠情况[24]。而社会网络关系图则更直观地展示了点度中心度较高,也就是与其他关键词相连较多的关键词,进而判断洁净煤技术专利申请中的核心关注点。
以数据预处理得到的关键词作为专利名称文本的行特征词,用Bibexcel软件构建关键词共现矩阵(表3)。将共现矩阵导入Netdraw,绘制关键词的社会网络关系图(图5)。从图中可知,“气化”、“净化”、“脱硫”、“回收”、“制备”、“焦炉”、“废水”、“煤气”等几个关键词与其他关键词有着更高的关系强度,即这些词代表了洁净煤技术专利研发中较为关注的点,与这些词相关的技术和其他技术领域的关联程度较大,在所有技术中也占到较大比例。同时还可以大致推断出我国洁净煤技术的专利申请热点与煤炭燃烧过程以及燃烧前后的处理有关。


3.3 LDA主题模型
3.3.1 最优主题数选取
在对关键词进行初步分析的基础上,接下来对专利文本进行LDA主题建模,首先需要确定主题数目。主题数目的选取会影响到LDA模型的准确性,过多或过少的主题数目都会使得主题的文本语义信息不显著。文中采用主题困惑度(Perplexity来确定最优主题数k,主题困惑度随主题数的变化趋势如图6所示。当主题数为6时,困惑度出现明显的最低值,此时按照k=6训练得到的

3.3.2 主题挖掘结果
确定主题数目为6后,接下来使用Gensim库进行LDA主题建模,其中Gibbs抽样迭代数设为200,调整好模型参数后可得LDA模型的词分布(见表4)。之后使用pyLDAvis库对生成的主题进行可视化并计算主题强度。可视化图中的每个圆圈都代表一个主题,数字表示对应主题的序号,圆圈的大小表示了包含该主题的评论的数目,圆圈之间的距离表示各个主题之间相关性的大小。从图7可知,各个主题之间有比较明显的区分度,文中建立的LDA模型能较好地反映出我国洁净煤技术专利文本的主题内容。


3.3.3
主题特征分析
主题T1的特征是煤液化回收制油技术,该主题占到专利总数的23.8%,其关注焦点是将固体的原料煤转化成替代石油的液体燃料和化工原料[25],主要包括煤的直接液化技术和间接液化技术,对于保障能源安全有重要意义,因此在专利申请中占比最大,应用空间也较为广阔。
主题T2的特征是煤气化复合制备技术,该主题占到专利总数的16.2%,其关注焦点是利用氧化剂等催化物以一定的流动方式(流化床等)将固体煤转化为可燃气体和非可燃气体等能源产品,例如常用来制造工业燃气、民用煤气等[26]。
主题T3的特征是煤化工废水处理技术,该主题占到专利总数的15.5%,其关注焦点是对煤化工企业产生的废水进行预处理、生物处理和后续处理,以减少有害物质排放,提高有用物质的利用率,实现对煤化工废水的零排放和循环利用。
主题T4的特征是煤固体循环发电技术,该主题占到专利总数的15.2%,其关注焦点是将煤固体及其化合物的气化技术与循环发电技术相结合,以提高用煤发电的效率,缓解我国煤炭资源短缺的情况。从可视化图中可以推断出T4与T2在技术领域上存在较近的相关关系。
主题T的特征是低阶煤分级转化技术,该主题占到专利总数的14.9%,其关注焦点是利用煤炭各组成成分的不同性质和转化特性,通过不同的热解燃烧方式实现煤炭的分级转化和综合利用,例如产生煤焦油、煤气等。可视化图中显示T5与T3主题内容存在部分重合,这2类技术都与煤的充分利用有关。
主题T6的特征是煤烟气脱硫除尘技术,该主题占到专利总数的14.4%,其关注焦点是对煤炭燃烧后产生的烟气进行一体化脱硫除尘操作,包括利用湿法、干法以及半干法等技术降低烟气中二氧化硫的排放,减少大气污染。
4 结论与建议
4.1 结论
1)我国洁净煤技术的专利申请总体呈上升趋势,在2019年出现第一个增长高峰,但2020年专利申请数量有所下降,一方面是由于新冠疫情造成的技术研发外部环境不稳定,另一方面也与国家知识产权局严格的专利审查制度有关,目的是激励科研人员专利申请由多到优。但总体看当前洁净煤技术仍处于快速成长期,伴随着国家创新发展战略和双碳目标的驱动,后疫情时代专利申请仍有望继续回升。
2)从来源机构看,企业等生产经营单位在洁净煤技术的专利申请中占据更多比重,表明国家对企业的政策和经济方面的扶持对企业创新科技较为有效。部分煤炭能源企业也在近年来也加大了相关技术的研发,在提高企业煤炭资源利用效率的同时实现可持续发展。但高校等科研院所对洁净煤技术的专利研发相对较少,尖端理论探索与专利技术开发的结合仍然较弱,未来应加大科研成果向实践操作的转化。
3)除东部发达省份的洁净煤技术专利申请数量保持较高水平外,东北地区的辽宁省、西部的陕西省以及中部的山西省也在洁净煤技术的专利申请上表现出较为活跃的状态,说明国家颁布的对中西部以及东北地区的科技振兴和技术扶持政策较为有效。
4)在LDA模型提取出来的6个热点主题中,T1占比最大,煤制油技术作为石油资源的补充,对保障我国能源安全有重要意义,其过程中涉及到的清洁转化技术也是当前研发人员考虑的重点,在洁净煤技术领域有较为广阔的发展空间。与之相关的T2、T4也是属于将煤转化为清洁能源的技术,T5关注的是煤的清洁燃烧过程,T3和T6则更多关注煤燃烧后的处理,即废水和烟气的清洁处理。
4.2 建议
1)深化煤炭领域的产学研合作,促进高校科技成果转化。相较高校来说,企业拥有生产能力和市场,而高校和科研院所往往拥有更多人才和平台,二者通过产学研合作可以共享资源,发挥更大的科技创新优势。因此政府应完善相关政策,支持煤炭产业的一些龙头企业与高校和科研院所深度合作,加快清洁低碳技术的创新突破。
2)加强各省份之间的跨地域合作,培养煤炭产业高层次人才。东部省份往往科研实力较强,而中西部等省份却拥有更多的煤炭资源和实践基地,因此东部发达省份可以考虑与中西部等产煤大省进行跨地域交流合作,完善科技协同创新体系,通过人才互动流通、技术交流互助等措施促进我国洁净煤技术的高效发展。
3)重视热点技术的专利研发,有序优化技术创新布局。作为研发的热点领域,煤制油技术需要在相应政策的支持下大力发展,其难点重点技术的科研攻关是当前我国煤炭实现清洁高效利用的重要任务。此外,也不能忽视对其他领域的布局规划,例如我国洁净煤技术的专利研发还需朝着清洁能源制备、循环发电、以及煤化工废水处理和煤烟气除硫处理等热点领域快速发展,技术布局的创新优化对于充分利用煤炭资源、实现可持续发展具有重要意义。
参考文献:
[1]国家发展和改革委员会.关于印发“十四五”全国清洁生产推行方案的通知[Z].2021-10-29.
[2]国务院.关于印发“十四五”节能减排综合工作方案的通知[Z].2022-01-24.
[3]高天明,张艳.中国煤炭资源高效清洁利用路径研究[J].煤炭科学技术,2018,46(07):157-164.
[4]孙旭东,张博,彭苏萍.我国洁净煤技术2035发展趋势与战略对策研究[J].中国工程科学,2020,22(03):132-140.
[5]TANG X, SNOWDEN S, MCLELLAN B C, et al. Clean coal use in
China
: Challenges and policy implications[J]. Energy Policy, 2015, 87: 517-523.
[6]刘峰,郭林峰,赵路正.双碳背景下煤炭安全区间与绿色低碳技术路径[J].煤炭学报,2022,47(01):1-15.
[7]帅永,赵斌,蒋东方,等.中国燃煤高效清洁发电技术现状与展望[J].热力发电,2022,51(01):1-10.
[8]王芳,曾玺,王婷婷,等.基于过程强化与反应调控的煤定向热解制高品质油气产物基础研究及中试验证[J].化工学报,2021,72(12):6131-6143.
[9]张文,林长喜,彭永臻.现代煤化工废水近零排放技术集成与优化建议[J].环境工程,2021,39(11):41-45+109.
[10]张保留,王健,吕连宏,等.对资源型城市能源转型的思考——以太原市为例[J].环境工程技术学报,2021,11(01):181-186.
[11]王迪,边曦琛,聂锐.长三角工业SO2排放驱动因素全周期因素分解及其区域差异[J].科技管理研究,2019,39(16):91-99.
[12]陈茜,刘扬,苏利阳,等.不同煤电技术选择的综合环境经济影响分析[J].系统工程,2014,32(10):118-125.
[13]柴瑞瑞,李纲.可再生清洁能源与传统能源清洁利用——发电企业能源结构转型的演化博弈模型[J].系统工程理论与实践,2022,42(01):184-197.
[14]陈伟,林超然,孔令凯,等.基于专利文献挖掘的关键共性技术识别研究[J].情报理论与实践,2020,43(02):92-99.
[15]刘建明,颜学明.基于专利计量的区块链技术发展现状及关键技术分析[J].科技管理研究,2021,41(16):37-44.
[16]方曦,张莉萍.国内外新能源汽车充电桩技术预测分析——基于生命周期和国际专利分类号[J].科技管理研究,2021,41(08):148-155.
[17]刘东霞,陈红.煤炭液化技术研发趋势、生命周期、前沿技术与影响因素——基于专利的视角[J].情报杂志,2017,36(07):52-58.
[18]王江,张月.煤化工技术群组分类和趋势预测——来自专利数据的分析[J].技术经济,2019,38(08):17-24.
[19]陈欣然,李国正,崔一迪,等.基于专利计量的全球人工智能技术在医疗健康领域应用发展态势分析[J].科技管理研究,2021,41(03):139-147.
[20]ZHAO F, ZHU Y, JIN H, et al. A personalized hashtag recommendation approach using LDA-based topic model in microblog environment[J]. Future Generation Computer Systems, 2016, 65: 196-206.
[21]韩芳,张生太,冯凌子,等.基于专利文献技术融合测度的突破性创新主题识别——以太阳能光伏领域为例[J].数据分析与知识发现,2021,5(12):137-147.
[22]席笑文,郭颖,宋欣娜,等.基于Word 2 vec与LDA主题模型的技术相似性可视化研究[J].情报学报,2021,40(09):974-983.
[23]FEICHENG M, YATING L. Utilising social network analysis to study the characteristics and functions of the co-occurrence network of online tags[J]. Online Information Review, 2014.
[24]陈钰芬,王科平.基于专利技术共现网络的人工智能跨领域融合模式识别[J].情报杂志,2021,40(07):8-15+29.
[25]卫小芳,王建国,丁云杰.煤炭清洁高效转化技术进展及发展趋势[J].中国科学院院刊,2019,34(04):409-416.
[26]柯希玮,蒋苓,吕俊复,等.循环流化床燃烧低污染排放技术研究展望[J].中国工程科学,2021,23(03):120-128.
作者简介:石晓敏(1998—),女,山西忻州人,硕士研究生,主要从事技术经济管理方面的学习与研究。