问题描述
- pynlpir中为什么分词器对于多行的文件不能分词
- 问题是这样的:我用了中科院分词器的python版本的api,pynlpir,它可以支持对文件进行分词操作。
但是对于单行的文本文件可以分词,对于多行的文本文件不能分词,这是什么情况。这是我下面的调用接口:
#对文件进行分词
def splitFile(sSrcFileName sDstFileName):
if not nlpir.Init(nlpir.PACKAGE_DIR nlpir.UTF8_CODE None):
logging.INFO(""初始化分词器失败"")
return False
nlpir.FileProcess(sSrcFileName sDstFileName False)
nlpir.Exit()
return True我需要分词的文件为:a.txt,它的内容如下:
Point(1.687499-6.458334{A});
Point(7.229166-4.583334{B});
Segment(56{});
PointFlexRotate(561/2t{C});
Segment(68{});
Parallelogram(865{D});
Segment(810{});
Segment(105{});
PointOnLine(7{E});
Segment(613{});
Variable(t124.000000173.000000{});
PointFlexRotate(1361t{G});
Segment(616{});
Translate(13616{H});
Translate(13168{J});
Translate(16135{K});
Translate(201819{L});
Point(7.3541652.083333{M});
Segment(1822{});
Translate(191822{N});
。。。
后面还有多行的文件调用这个更接口后,python程序在走到nlpir.FileProcess(sSrcFileName sDstFileName False)这个地方就停住不动了
请教各位朋友,这是什么情况pynlpir不支持多行内容的文件进行分词吗?有什么解决方法?十分感谢
解决方案
同问,我用他自带的python接口seg(paragraph), 老是崩溃,把同样内容放到他的网页上测试就解析的很好,不懂他们是怎么用的
时间: 2024-11-30 12:35:02