问题描述
现在想要分析一部小说中不同人物出现的次数,,不是单个字符哦==比如说神雕侠侣中杨过出现的次数。找了不少资料和代码,发现大部分都是统计英文中单词出现的次数,而且英文中有空格可以用来分割,但是一句话中要怎么提取出特定的一个词啊,(还要尽量考虑别名的情况,比如杨过还叫过儿啊===)次数统计的方法可以用TreeMap就不用说了。。。妈蛋的课设。。求大神解答
解决方案
解决方案二:
对了,因为文本要求是20万字以上所以我用的是RandomAccess读的文件
解决方案三:
还有杨大哥,傻蛋...
解决方案四:
杨兄,杨兄弟,杨贤侄,杨相公,杨郎,大哥哥,杨居士,姓杨的,神雕侠,神雕大侠
解决方案五:
杨少侠,杨大侠,姓杨名过,杨老弟,杨公子,杨某,杨哥哥,杨师弟,杨英雄,杨爷,杨家哥哥,姓杨的小子,杨小邪,杨君,杨相公
解决方案六:
解决方案七:
杨大爷,西狂,傻兄
解决方案八:
引用3楼waynexuan的回复:
杨兄,杨兄弟,杨贤侄,杨相公,杨郎,大哥哥,杨居士,姓杨的,神雕侠,神雕大侠
卧槽兄弟你太机智了,继续
解决方案九:
我晕!
解决方案十:
各位可以上点心么!妈蛋
解决方案十一:
正则表达式在有中文的时候可以用吗,如果可以,那就匹配吧
解决方案十二:
引用10楼dahlwuyn的回复:
正则表达式在有中文的时候可以用吗,如果可以,那就匹配吧
我现在用的是Scanner,可以扫描一个人名了。但是因为人名储存在数组中,用For循环的话,扫描完第一个人,Scanner就读到文件末尾了,有没有一种循环可以让Scanner多次扫描的,不然就只能同样代码写十遍了==
解决方案十三:
这个还是用全文检索吧。lucense
解决方案十四:
推荐正则表达式
解决方案十五:
引用12楼huxiweng的回复:
这个还是用全文检索吧。lucense
OH,不能再改了。。明天上午就要交了,今天还有一下午的课
解决方案:
引用13楼zhu19870712的回复:
推荐正则表达式
11楼问题求解答。。。
解决方案:
你目前的方式应该是有多少组人名就会将整个文件扫描多少次吧,不能改成一次扫描匹配多组人名吗?
解决方案:
引用11楼u011228889的回复:
Quote: 引用10楼dahlwuyn的回复:
正则表达式在有中文的时候可以用吗,如果可以,那就匹配吧我现在用的是Scanner,可以扫描一个人名了。但是因为人名储存在数组中,用For循环的话,扫描完第一个人,Scanner就读到文件末尾了,有没有一种循环可以让Scanner多次扫描的,不然就只能同样代码写十遍了==
用那个可推回的输出流吧,或者随机读写文件流