问题描述
- 一段文字中有姓名,地址,联系方式等,如何准确的将他们找出来
-
如果一段文字中有姓名,地址,学校等,顺序什么可能会乱,如何准确的将他们找出来。
每段话可能不规整,标点符号可能会漏,学校XX,姓名张三,住XXXX,。
名字李四女,住sss,学校XX
解决方案
规则文本用正则匹配,非规则需要语义分析了,参考如下paper
http://www.docin.com/p-320577813.html
http://wenku.baidu.com/link?url=gT1-rbw0qEBj7er6Dro0izdyaBmfAvg0YEcm1HEo5hKGnP2RZp08V4-99iX7jhcMLu955V7BrhW25yR2XtzYkql_Aea42YjRdmJE7LrVfke
解决方案二:
模糊查询就好了,定义一些关键字,关键字总不会漏吧?
解决方案三:
正则表达式匹配啊
解决方案四:
不规则的话,,可能有点难取吧,,
时间: 2024-12-10 11:50:26