问题描述
- java中怎么判断一行字符中有姓名,并得到姓名
-
例如:【杨绛先生今日凌晨去世,享年105岁[蜡烛]】5月25日凌晨,著名女作家、文学翻译家和外国文学研究家、钱锺书夫人杨绛在北京协和医院病逝,享年105岁。澎湃新闻经由人民文学出版社对这一消息进行了确认。怎么从中得到杨绛,钱钟书
解决方案
这个涉及到语义分析了,一般来说是对中文分词,然后对照词典,根据百家姓找没有列出的词,以姓氏开头2-3个字符长度。
解决方案二:
个人认为:收集全部姓名是不可能的;再者可以收集先生 小姐 夫人之类的;再截取前面的四个字(大部分人姓名是四个字一下吧?);再匹配姓氏。
解决方案三:
如果有“先生”“夫人”“小姐”“女士”之类的,就截取前面的三个或者两个字,如果没有前述的几个称呼的,那就得去解析句子了,每个字拿出来,再截取到之后的两个或三个字组成一个名字。
时间: 2024-10-28 05:22:58