问题描述
- 请教nutch和solr集成问题
-
最近在学习搜索引擎,按照nutch官网上的教程下载了nutch2.2.1和solr4.6.1
通过执行bin/crawl 能够在hbase数据库中看到爬虫下载的网页,但是solr 里面没有数据且没有异常,为什么呢?
请高手帮忙注:采用nutch1.7可以成功进行索引
解决方案
可以问你个问题么,我用的nutch2.2.1 solr4.8 hadoop1.1.2 hbase0.94 ,为什么nutException in thread "main" java.lang.NullPointerException
at java.util.Hashtable.put(Hashtable.java:542)
at java.util.Properties.setProperty(Properties.java:161)
at org.apache.hadoop.conf.Configuration.set(Configuration.java:419)
at org.apache.nutch.indexer.IndexerJob.createIndexJob(IndexerJob.java:128)
at org.apache.nutch.indexer.solr.SolrIndexerJob.run(SolrIndexerJob.java:44)
at org.apache.nutch.crawl.Crawler.runTool(Crawler.java:68)
at org.apache.nutch.crawl.Crawler.run(Crawler.java:192)
at org.apache.nutch.crawl.Crawler.run(Crawler.java:250)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
at org.apache.nutch.crawl.Crawler.main(Crawler.java:257)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:601)
at org.apache.hadoop.util.RunJar.main(RunJar.java:156)ch在爬取过程报错
你用的版本是多少的
解决方案二:
我也遇到这样的问题, 最后怎么解决的呢