如果采集项目定义了多个模板,项目在采集运行时,指是否在内容页面采集匹配之前将其与所有定义的模板进行比对和重新排序,从中寻找最相符的模板并优先使用。
详:
勾选此项,可以提高匹配的精准度。如果项目只有一个模板,此项不起作用。
如果虽然有多个模板,但首项模板应用最多,且彼此间不会产生采集匹配误差。则可以不必勾选此项,这样可以适当提高项目采集运行效率。
熊猫采集的采集项目可以定义多个模板,每个模板下又可以定义若干个子页面模板。此处的模板匹配,只针对模板集合的首个入口模板,而不会对子项页面进行深度比对,因为这样等同采集匹配过程,且会大幅度降低系统效率。
此项的修改可以随时进行。