CFIE

 

 中国专利技术开发公司是我国规模最大的专利大数据深度精加工专业机构,拥有100多人的专利数据深加工队伍,专业覆盖全部技术领域,硕博士比例超过60%。中国专利深加工数据是针对中国发明专利和实用新型专利原始数据进行深度标引,将大量冗余无序信息提炼为结构化的专利文摘索引信息,为精准检索、多角度分析、快速浏览理解专利技术提供了高质量的数据基础,可以有效解决目前专利信息利用上存在的痛点和难点。该数据已连续十余年应用于国家知识产权局专利审查检索系统中。

      中国专利深加工数据包括名称改写、摘要改写、关键词标引、实用专利分类、引文标引、中国专利申请人机构代码标引等项目,最终形成了包含名称、技术问题和有益效果、发明点、技术方案、用途、活性、给药、作用机制、关键词、机构代码、引用、被引用信息等高端增值数据,形成了一套有独具特色的中国专利深加工数据索引(CPDI)

      使用频次方面,根据专利审查检索系统使用情况统计显示,含有深加工数据的中国专利文摘数据库使用次数是中国专利原始文摘数据库使用次数的15.5倍,是中国专利全文数据库使用次数的2.4倍。浏览效率方面,通过字数统计与阅读时间的换算,与阅读原始专利文献得到目标信息的时间相比,阅读深加工数据得到目标信息的时间,平均每篇节省将近4分钟。匹配效果方面,对于有摘要附图的专利文献,相比于原始专利摘要而言,深加工数据摘要的有效附图标记的匹配度提高了约9.4倍。检索性能方面,与原始专利文摘数据相比,利用专利深加工数据进行检索,对专利审查有直接影响的X/Y类文献的查全率提高了约40%,X/Y类文献的查准率提高了13%;与专利全文数据相比,利用专利深加工数据进行检索,对专利审查有直接影响的X/Y类文献的查准率提高了7.2倍。

      改写后的发明名称。 深加工数据通过名称改写在发明名称中增加了最能代表技术改进的相关技术信息,用户能够高效检索到更多有用信息,且通过发明名称即可大体判断是否需要扩展至摘要或者说明书全文进行浏览,降低用户浏览量。

      改写后的摘要。 原始专利申请由于法律语言风格、申请人撰写水平和技术知识等差异,申请文件存在技术术语不规范、描述晦涩等问题,使知识产权从业者和广大科研人员难以高效准确地获取重要技术信息。深加工中的摘要改写是在阅读专利说明书全文的基础上,提取重要信息并采用本领域通用的规范化技术术语进行结构化分类目撰写,包括要解决的技术问题和有益效果、发明点、核心方案、用途等信息,对于医药等特殊领域,还会提取药物的作用机制、活性、给药等信息。将隐藏在专利说明书中的重要技术信息提取到摘要中,使摘要信息更加丰富、准确、规范,可以有效缩小检索范围,提高摘要浏览性、可分析性和检索效率。

      规范化的关键词。 专利深加工的关键词标引是将技术方案中技术概念相同、表述方式不同的重要技术词汇标引成通用标准词汇,使检索用的关键词统一、规范。深加工数据的关键词标引由公司十多年人工标引构建的关键词及其同近义词库支撑。用户使用一个关键词检索,即可在数据库中实现 关键词族系的检索,提高了检索的查全率和查准率。如对技术术语“电子换向电动机、无电刷电动机、无刷马达、无电刷马达、无刷式电动马达”等,统一用规范的“无刷电动机”进行关键词标引。

      实用专利分类。 实用专利分类体系是公司在国民经济行业分类、其他国际标准产业分类体系的基础上创设的一套以行业应用为主的专利分类体系。实用专利分类密切结合了行业应用特点,为行业技术人员和普通公众检索专利信息提供符合行业应用习惯的便利分类工具,可以作为国际专利分类的有效补充。

      专利引文数据。 专利引文数据包括发明人专利申请中引用的文献和专利审查中引用的文献,可为量化评估专利技术影响力、量化测度知识关联性提供支撑。公司将中国专利引用文献按照规范格式进行信息要素标引,建立专利文献之间的引证和被引证关系,引文数据标引的完整性、规范性、聚类程度都处于国内领先水平,具备同步标引能力,方便检索人员进行专利文献和科技文献的追踪检索。

      专利申请人机构代码。 中国专利申请人机构代码为机关、企事业单位、社会团体以及其它组织机构类申请人赋予唯一的代码标识,对于名称不同、实质相同的申请人赋予相同的机构代码,如“宝洁公司”作为专利申请人有20余种表述,包括宝洁公司、普罗格特-甘布尔公司、普罗克特和甘保尔公司、普罗特和甘保尔公司等,造成以申请人名称进行检索极易发生漏检的问题,而利用宝洁公司对应的申请人机构代码“US00095601”检索,可以轻松检索到全部相关专利。