pynlpir对多行分词-pynlpir中为什么分词器对于多行的文件不能分词

问题描述

pynlpir中为什么分词器对于多行的文件不能分词
问题是这样的:我用了中科院分词器的python版本的api,pynlpir,它可以支持对文件进行分词操作。
但是对于单行的文本文件可以分词,对于多行的文本文件不能分词,这是什么情况。这是我下面的调用接口:
#对文件进行分词
def splitFile(sSrcFileName sDstFileName):
if not nlpir.Init(nlpir.PACKAGE_DIR nlpir.UTF8_CODE None):
logging.INFO(""初始化分词器失败"")
return False
nlpir.FileProcess(sSrcFileName sDstFileName False)
nlpir.Exit()
return True

我需要分词的文件为:a.txt,它的内容如下:
Point(1.687499-6.458334{A});
Point(7.229166-4.583334{B});
Segment(56{});
PointFlexRotate(561/2t{C});
Segment(68{});
Parallelogram(865{D});
Segment(810{});
Segment(105{});
PointOnLine(7{E});
Segment(613{});
Variable(t124.000000173.000000{});
PointFlexRotate(1361t{G});
Segment(616{});
Translate(13616{H});
Translate(13168{J});
Translate(16135{K});
Translate(201819{L});
Point(7.3541652.083333{M});
Segment(1822{});
Translate(191822{N});
。。。
后面还有

多行的文件调用这个更接口后,python程序在走到nlpir.FileProcess(sSrcFileName sDstFileName False)这个地方就停住不动了
请教各位朋友,这是什么情况pynlpir不支持多行内容的文件进行分词吗?有什么解决方法?十分感谢

解决方案

同问,我用他自带的python接口seg(paragraph), 老是崩溃,把同样内容放到他的网页上测试就解析的很好,不懂他们是怎么用的

时间: 2024-11-30 12:35:02

pynlpir对多行分词-pynlpir中为什么分词器对于多行的文件不能分词的相关文章

python分词-pynlpir在ubuntu下为什么不能对带有中文路径的文件分词

问题描述 pynlpir在ubuntu下为什么不能对带有中文路径的文件分词 问题是这样的:我在win7环境下用pynlpir对带有中文目录的文件是可以分词的,但是如果在ubuntu环境下,发现分词失败,尝试了几十次,在ubuntu环境下对带有中文路径的文件进行分词,发现无法分词,不知道这是不是一个bug. 下面是我的调用代码: from pynlpir import * #对文件进行分词 def splitFile2(sSrcFileName , sDstFileName): if not nl

c++-用C++读取文件中特定行的某几列数据并输出到另一个文件

问题描述 用C++读取文件中特定行的某几列数据并输出到另一个文件 AR ZIMM 2014 06 30 00 00 0.000000 2 2.175456910513e-08 1.929140019560e-11AR ZWE2 2014 06 30 00 00 0.000000 2 -6.930289135325e-03 2.317673679230e-11AS G01 2014 06 30 00 00 0.000000 2 1.652894267903e-05 1.737915981300e-

在Word文档中按指定的间隔显示行号的方法

  在Word文档中按指定的间隔显示行号的方法         1.启动Word 2013,打开需要添加行号的文档.在"页面布局"选项卡中单击"页面设置"按钮打开"页面设置"对话框,在"版式"选项卡中单击"行号"按钮,如图1所示. 图1 "页面设置"对话框 注意 在"页面设置"组中单击"行号"按钮 ,在打开的列表中选择"无"选项

myeclipse中怎么显示编程代码的行序号?

  myeclipse中怎么显示编程代码的行序号?接下来我会简单说下如何在myeclipse中显示行序号和web.xml文件的注意事项 1.先来说下显示行序号的问题.将鼠标移至程序左侧,鼠标右键单击,勾选"show line numbers"即可 注意了,我们在编辑web.xml文件时,千万别把原先的这段程序删掉,如图所示,直接在下面编辑即可,否则会容易出现错误. 2.当我们编辑web.xml文件时,会出现如图红色标记处的红色下划线现象,此时这些并不会影响程序的运行,但是你要想去除掉,

c#中如何表示矩阵的某行或者某列

问题描述 c#中如何表示矩阵的某行或者某列 c#中如何表示矩阵的某行或者某列,比如说A矩阵是一个3*3的矩阵,A矩阵的第二列是由另外一个3*1的矩阵填充的,这种情况应该怎么写代码? 解决方案 使用交错数组,或者使用稀疏矩阵的方式表示.前者,比如int[][] matrix后者Tuple<int int int>[] matrix

scala-spark中怎么将读取某几行数据合并成一行啊? 新手 谢谢 !

问题描述 spark中怎么将读取某几行数据合并成一行啊? 新手 谢谢 ! 例如图片里说的 谢谢啦 数据是读取的外部csv文件 麻烦啦 求大神指教一下 解决方案 sehll脚本将几行输出合并成一行显示 解决方案二: http://bbs.csdn.net/topics/391872110

listview-点击 ListView 中的 item,然后改变行的背景颜色

问题描述 点击 ListView 中的 item,然后改变行的背景颜色 我想使用BaseAdapter 在ListView中显示item.我在BaseAdapter使用下面的代码: @Override public View getView(final int position, View convertView, ViewGroup parent) { //... convertView.setOnTouchListener(new OnTouchListener() { @Override

图片-关于学习《第一行代码》中发现的问题,不敢说是错误,应该是郭霖大神笔误。麻烦各位大神来教训晚辈。。。

问题描述 关于学习<第一行代码>中发现的问题,不敢说是错误,应该是郭霖大神笔误.麻烦各位大神来教训晚辈... _第一处问题:在fragment一章里关于动态加载fragment部分中,要添加的fragment类的代码如下 public class Fragment_3 extends Fragment { @Override public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedIn

vb-VB中一个过程最多包含多少行代码

问题描述 VB中一个过程最多包含多少行代码 我在使用VB编写一个应用程序时,其中点击一个按钮后要执行很多动作,所以代码数量比较多.但是当我代码到几千行时,弹出提示,过程超过代码行数.我想请问,VB中,一个过程最多包含多少行代码? 解决方案 可以加窗体(函数),load窗体