问题描述
事件描述->已有数据:1.大量的文本文件2.已知关系的名词对,比如:catisaanimal,dogisaanimal.这些大量的文本文件当然都是关于这些名词对的。需要实现:在大量的文本文件中找到能证明那些名词对关系的词:比如:suchas,forexample,including之类的。目前的思路,1.读取每个文本文件,提取同时包含2个名词的句子,再提取这2个名词之间的其他词,做统计。实验下来,此方法的确能找到这样的词,而且出现频率很高。但是此方法有其局限性,比如会产生一些出现频率也很高的,但不能证明名词间关系的词。所以请高人指点迷津,是否有其他更有效的算法,或者在我的思路上如果改进~
时间: 2025-01-26 16:57:13