问题描述
大家好,请问,若运行自己的数据,怎么才能与mahout中的算法相关联呢?也就是说,自己的数据应该以什么样的顺序放在文档中呢?详细描述:(1)我现在要用到mahout中的(贝叶斯)算法,可它在网上资料都提的(20Newsgroups)这样的数据集,那我怎么样将我的业务数据转换成mahout能够读取的文件?(2)mahout仅支持SequenceFile格式的文件,那我们可以用mahout本身的mahoutseqdirectory将文本文件来转换。可我进行转换时就会报错,请问,文本文件中数据的格式是什么?
解决方案
解决方案二:
怎么没有人回答呀,求大神!!!
时间: 2024-12-20 11:15:29