用户登录
用户注册

分享至

spark lda

  • 作者: 刑奕姗
  • 来源: 51数据库
  • 2020-09-23
spark lda 怎么用已经生成的model 预测新文章分类
操作文件(Files)
对文件进行的操作要比以上介绍的驱动器(Drive)和文件夹(Folder)操作复杂些,基本上分为以下两个类别:对文件的创建、拷贝、移动、删除操作和对文件内容的创建、添加、删除和读取操作。下面分别详细介绍。
(一)创建文件
一共有3种方法可用于创建一个空文本文件,这种文件有时候也叫做文本流(text stream)。
第一种是使用CreateTextFile方法。代码如下:
var fso, f1;
fso = new ActiveXObject("Scripting.FileSystemObject");
f1 = fso.CreateTextFile("c:\\testfile.txt", true);
第二种是使用OpenTextFile方法,并添加上ForWriting属性,ForWriting的值为2。代码如下:
var fso, ts;
var ForWriting= 2;
fso = new ActiveXObject("Scripting.FileSystemObject");
ts = fso.OpenTextFile("c:\\test.txt", ForWriting, true);



  这个是因为预测时处理documents的文本表示的时候结果与训练时不同,后面预测的时候自己生成词汇表,与之前训练的时候的词汇表不同,所以文本表示的时候文本向量自然不同,因此出现了这种结果!
  经过代码修改后,用之前训练时的词汇表进行新文档的文本表示结果就比较一致了。
软件
前端设计
程序设计
Java相关