问题描述
最近在做一个关于搜索我们学校通知的搜索引擎我照着书上说的那样,配置了自己的Extractor和FrontierScheduler类,但是最后抓的还是有很多不想要的东西(有自己想要的)请问如何解决这个问题,请高手帮个忙
解决方案
解决方案二:
这个太笼统了,不知道你想要什么
解决方案三:
我想抓取我们学校网上的所有有关通知的网页,但是总是会抓到别的无关的网页,
时间: 2024-10-28 09:59:54
最近在做一个关于搜索我们学校通知的搜索引擎我照着书上说的那样,配置了自己的Extractor和FrontierScheduler类,但是最后抓的还是有很多不想要的东西(有自己想要的)请问如何解决这个问题,请高手帮个忙
解决方案二:
这个太笼统了,不知道你想要什么
解决方案三:
我想抓取我们学校网上的所有有关通知的网页,但是总是会抓到别的无关的网页,