她具有界面友好,容易上手,功能強(qiáng)大的特性。任何一個(gè)規(guī)則都由可視化引擎自動(dòng)生成模板。您僅需要?jiǎng)右粍?dòng)鼠標(biāo),即可以完成一個(gè)網(wǎng)站模板。大大減輕您學(xué)習(xí)、培訓(xùn)及維護(hù)的時(shí)間和成本。
另外,她內(nèi)置了中文分詞和lucene2.3全文索引,將您采集的數(shù)據(jù)直接索引。并提供lucene API,您只需制作前端網(wǎng)頁(yè),即可輕松擁用像google生活(http://shenghuo.google.cn/shenghuo/),愛幫網(wǎng)(http://aibang.com)這樣的垂直搜索引擎。
她獨(dú)有的spider路由功能,支持網(wǎng)站按頻道、版塊來(lái)采集數(shù)據(jù),支持定義路徑。比如,針對(duì)58同城這樣的分類信息網(wǎng)站。我們往往希望將它上面的信息,比如租房信息,按照城市(北京、上海,大連等)搬進(jìn)我們自己的數(shù)據(jù)庫(kù)。這時(shí)候,傳統(tǒng)的采集軟件(火車頭,網(wǎng)絡(luò)神采)就無(wú)能為力了。