clfu2000 2007-12-17 15:50
DII、esp@cenet、CA在科技查新专利检索中的应用
根据世界专利合作条约组织的规定,专利查新最低文献量应包括英、美、法、德、日、苏(俄)、意及PCT、EPT等七国二组织专利说明书和169种核心期刊;而国内进行的科技成果查新或立项查新,虽尚未制订专利检索范围的具体规定,但通常认为其覆盖的范围应该比专利查新更大。因此,专利文献对于科技查新工作,是一类相当重要的文献。选择一种或几种恰当的专利数据库,对于提高专利文献查全率、查准率,保证查新工作质量,具有重要意义。
+I*bY ?"e7~
传统的专利文献检索工具主要是德温特公司出版的《世界专利索引》(WPI),但实践中具有一定局限性:①检索体系的复杂性(无论印刷版或联机版),要求使用对象具有专业的情报检索知识;②刊物收藏的非普及性,限制了用户范围;③昂贵的联机费用,使检索人员联机操作时,往往不能随意修改检索策略以尝试多种检索途径,妨碍了检索的准确性和全面性。
:K^Qz7J
因此,寻找使用方便且数据质量稳定可靠的专利信息检索工具,对科技查新工作乃至科研人员的研发工作都具有重大意义。
iO7e)j5Z
&\
s5E`g,a
科技查新中几种常用专利检索工具 Sx)O AN
^"tWet
随着网络信息技术的发展,近年来多种基于Web的专利数据库应运而生。ISI和Derwent Information两大国际出版公司,通过集成Derwent World Patents Index(德温特世界专利索引,WPI)和Derwent Patent Citation Index(德温特专利引文索引,PCI),提供了一种基于互联网的全新专利信息资源:Derwent Innovations Index(德温特世界专利创新索引,DII)数据库。DII具有远比WPI更强的检索功能和更多的信息内容,可望成为信息检索与科技查新工作的重要信息源。
l7e'^~tmH
互联网上还有一些免费专利数据库,虽然它们中大多数只覆盖一个或少数几个国家或组织的专利信息,如USPTO Web Patent Database、 Canadian Patents Database、WIPO PCT Database、Japanese Patent Office等;但也不乏象esp@cenet这样的佼佼者。这个由欧洲专利局提供的网上专利检索系统,提供有数十个国家和专利组织的专利书目摘要信息,其中不少带有说明书全文,在查新过程中需对比相关专利技术细节时尤为方便。由于收录面覆盖全球范围,esp@cenet备受用户推崇,而它目前提供完全免费使用,更在企业用户、普通大众中颇受青睐。
t`)G6k.T-^iH,{
此外,《化学文摘》(CA)在专利信息检索方面也有独到之处。CA收录报道了约三十个国家和地区(包括EPO和WIPO两个世界性专利组织)的化学化工领域专利文献。凭借其无与伦比的强大检索功能与完备的收录内容,可作为检索化学化工领域专利信息的重要工具。8T!a/YG5f'O:[8R
本文将对DII、esp@cenet、CA三种工具检索专利的特点加以对比,讨论其各自的优势与缺陷,分析如何在科技查新中视具体需要选择恰当的检索工具,从而获得最好的专利信息检索效果。
)su6] f
W{
o`(d'S*~.`F/z9I"I
专利文献报道特征比较?m[!MG'G-C zpt
三种检索工具的报道内容各具特色:就地域范围,以esp@cenet覆盖最广,截至2002年8月,共收录有71个国家或地区(含几个专利组织)的3800多万专利;就专利报道量,当首推DII,它自我评价为世界上内容最全面的专利数据库,专业领域包括化学、电子与电气、工程技术,CA由于学科特点决定其专利文献报道限于化学化工领域,报道量自然不可相提并论;但就时间跨度来看,CA自1907年创刊当年即开始报道专利,数据回溯时间最长。Gq3Pip:MiQ|+Y
此外,esp@cenet免费提供有30个专利机构的说明书全文;DII本身不带有全文,但对订购了全文服务的用户提供了到Delphion知识产权网络的链接点,用户可通过该链接获取来自美国、EPA、EPB、PCT、INPADOC及日本(英文摘要)的专利文献;CA没有提供全文功能。 CB4O|]
?4Rl(zgTa
\!o`B/P
数据库 国家(地区)、组织 专利报道量 全文 回溯时间 .CjIY6]E,P2]?
DII 40多 4000多万 无 1963
#ng(z{4x2r1Q
esp@cenet 71 3800多万 有 1920 (l
ad w`)w
CA 29 —— 无 1907 ^dC@?Dy;J[0Z
8DL.f
r-I+?%^ KD
专利文献检索特征比较
$Y|#iMZ;b,u"ug
DII提供了一般检索、引用检索、高级检索、复合检索等四种检索方式。一般检索方式有主题(包括专利名称)、专利权人、发明人、专利号、国际专利分类号、德温特分类代码、德温特手册代码、或德温特专利入藏号等检索入口;引用检索方式,提供通过被引专利号、被引专利权人、被引专利发明人、被引专利的德温特入藏号进行检索的功能,引用检索正越来越受到研究人员的重视;DII还提供有非常强大的高级检索方式,熟练的专家级用户可以组织出更精确复杂的检索策略,以查找所需要的专利信息。
c{m3ot ricS+I
esp@cenet主要提供了一种检索方式,其界面类似于DII的一般检索方式,用户也可从专利名称、专利名称/摘要、专利号、申请号、优先权号、公布日、申请人、发明人、EC号、IPC号等检索项进行专利检索。H~MG"v$RjD
CA同样提供有主题、专利权人、发明人、专利号等检索入口,此外CA还提供有普通主题、化学物质名称、化合物登记号、分子式几大特色索引,使检索功能更为强大完善。
hM
{.@^
以下笔者将通过检索实例对三个数据库进行对比分析。
-V'}o,}v6]Y:D
v9jSgu9^
主题(专利名称和摘要)检索
c}$Y-P#u\
检索样例1:以US6255071为例,对比专利原始文献、esp@cenet、CA、DII中对专利名称和摘要的著录特征[9SNp5O]N
通过对比可以发现:3mNR@-X.W
esp@cenet基本沿用了原始专利的名称及摘要(非英文专利则采用其名称与摘要的英文翻译),因此标题不免带有含糊性和不明确性。OTf J)L8Mx9I8vA9[
CA对名称和摘要都经过加工整理,改写后比原文更明确具体。
l@J6R W(C"t
DII则对原始专利标题进行了严格整理和深度加工标引,根据专利内容重新撰写了简明精确的标题,注重突出发明内容与新颖性;标引后的篇名即相当于一个微型文摘,除禁用词外,均为规范化的主题词。并且,根据专利全文内容,DII为包括30多种非英语文本的专利文献提供有250~500字左右的摘要,详细介绍了专利的权利声明、发明内容、主要用途和技术优势等。F#T eTEWS3d$na*z
相形之下,检索DII和CA能得到更全面准确的检索结果。由于CA重在提供完备的索引增强检索功能,因此,二者中DII主题最详细清楚,它的题目与摘要都提供了有关专利本身的更多信息。
E(^ r\w
检索样例2:分别利用DII、esp@cenet检索有关“information processor”的美国专利Cn7`R_Q
2-1A:DII题名/文摘(1966-2003年):
c%|#b#cK!]1z/s
TS=(information processor) AND PN=(US*)
'HP;M1q c)G5|
Database(s)=Chemical Section, Electrical and Electronic Section, Engineering Section; Timespan=1966-2003
iOzaMr
1,391 document matched your query of the 11,843,638 in the data limits you selected.
1hv UW
eJo!d&[$|%H:I
2-1B:esp@cenet题名/文摘:,K;W*Lt{o8V
You looked for the following: ((information W processor))<TITLE OR ABS> AND (US)<PN>
~D.Z3f pL!y
352 matching documents were found.B7]8x'sK ~ ?9U
2-2A:DII题名(1970-2003):
0U$tWX#},Np7s5_g
TI=(information processor) AND PN=(US*)
lV3~)zZX*Qu
Database(s)=Chemical Section, Electrical and Electronic Section, Engineering Section; Timespan=1970-2003
F*N4p}tj
934 documents matched your query of the 11,685,972 in the data limits you selected.
[7u4B,a"rZ1{T$|I
2-2B:esp@cenet题名:B6Vcj/wd{
You looked for the following: ((information W processor))<TITLE> AND (US)<PN>
At-_yr0lm j7ZaC(n
194 matching documents were found.ND0l%I1|Tv4V
从上述检索结果发现,相同主题检索式的检索结果,DII要远远多于esp@cenet。究其原因,除了主题深度标引外,DII自动遵守的德温特“标题词”规范也是一个重要因素,依据该规范,标题词如Page, Pager, Paging等,会转换成其首选词形PAGE,这意味着名称或摘要字段与检索条件并不完全一致的记录也能被检索出来。这一特殊功能,使DII的文献查全率较esp@cenet有很大保障。(@N xX$v%noFc
此外,CA除对专利名称摘要的加工改写外,更通过提供多种索引清楚地表达专利本身的更多内容。CA的普通主题索引、化学物质名称索引、化学物质登记号索引、分子式索引等,提供了化学化工的专门检索入口,使我们可凭借分子式、化学物质登记号等条件检索到相关的专利信息。这在DII和esp@cenet中则须借助ICP等专利分类工具才有可能进行。因此,对于复杂的化学物质名称,检索CA是非常直接方便的选择,既相对减少了工作量,又对检索准确性有一定保障。Zod2igHd.Y:Fr.[
就检索技巧而言:DII、esp@cenet、CA三者都支持布尔逻辑检索与短语检索,但esp@cenet相比其它两者该项功能显然要弱得多。DII支持由布尔逻辑运算符连接的最多50个检索词条,esp@cenet的每个检索项则最多支持四个条件,否则便会出错,这使esp@cenet只能进行相对简单的检索。
T"Y5W|U;yT
DII和CA支持通配符检索,esp@cenet不支持。'b
Vg2j7L3f
rH
VGUVLAz
发明人/设计人aPCtEL#VT,?
DII中,不论检索条件输入还是检索结果输出,姓名拼写均采用“姓”加“名首字母”形式。实际检索中,建议名首字母后加上通配符,避免漏检;esp@cenet的发明人项拼写形式为姓前名后。但实际检索中,可采用姓前名后或名前姓后的形式;CA中,发明人为作者(Author)字段,也采用姓前名后形式,名字不缩写。FT3ZRk
^6V3}a
检索样例3:US6056958发明人的拼写格式
J_F2G!r]3J
数据库 检索条件输入格式 结果输出显示格式 &o^dYp)qsgj
说明书原文 —— SHAKER AHMED MOUSA r)AA2L&Ns)@:W
DII MOUSA SA MOUSA S A ;b(zP0s2UA,l
ESP MOUSA SHAKER AHMED
P/t`je^Y$V
或SHAKER AHMED MOUSA MOUSA SHAKER AHMED \#`|#I%GL0Z5b
CA MOUSA, SHAKER AHMED MOUSA, SHAKER AHMED
agC&w#cL5{
"N4m7u&k$QI
专利权人/申请人7Ag,iOm7X9k
DII为全球大约21000家公司分配唯一的四个字母代码,使公司名称标准化,从而使用户的检索更为准确和全面,也使DII网上实时查找公司代码变得非常方便。检索时可结合通配符使用,即使对公司名称不熟悉,也能试着逐步查找。
SL9j#W$k!e^
esp@cenet也提供有专利权人检索字段,检索时不能只用公司名缩写形式,应尽量多尝试可能的拼写方式,以免漏检,也可输入公司名中任一词或几个词进行检索。由于不支持通配符的使用,当用户对公司名称不熟悉时,检索多容易失败。
$^hhE;HQ
CA将专利权人归入机构(Organization)字段。由于输入的检索条件必须符合前方一致原则,所以尽管可接受通配符,其检索功能也比前两者要弱。如查Dupont Pharmaceuticals公司的专利,检索项必须以字母“D”开头,否则便不可能查到。SP mVc3a*x+m)z
a8`
[ztth;ef}c
专利号Ml8lK VP@v/c
三种数据库均提供有专利号检索字段,功能相差不大,只是在专利号的具体输入格式上有细微差别。具体检索某库时,需按该库要求输入格式准确的专利号。
}*T}7YCf,]j~
检索样例4:专利号的具体格式(以WO200046602为例) Pt,Tf+@)z
数据库 专利号格式
F*G0x"Cd[9H ^8@
说明书原文 WO 00/46602 &rmt/@E$U#B:j
DII WO200046602 TJja$Ge&s
ESP WO0046602 ;qB
g&lKd5P
CA索引记录 WO 2000046602 +Y hD4cg[#[
JI,l
P9SER/\+f
申请号O3g%qa"y
esp@cenet中,申请号格式为两位字母国别代码加申请年加七位序列号;CA中申请号也归入专利号字段。DII未提供申请号检索字段。l*^Q,j/l^
检索样例5:申请号的具体格式(以US6056958为例)$S(hd
av&D
数据库 申请号格式 p\n:e5j-~k
说明书原文 08/901,344 Rew%H0tJ#Gh
DII 未提供申请号检索入口