Skip to content

使用doc2vec生成句子,段落或者文章的向量,以便查找其之间的相似性

Notifications You must be signed in to change notification settings

zyc1310517843/doc2vec-

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 

Repository files navigation

doc2vec-

使用doc2vec生成句子,段落或者文章的向量,以便查找其之间的相似性

1.清洗数据集生成训练数据 如果需要获取文章的向量,需要将所有的文章利用解霸或者其他分词工具逐个进行分词,然后将分词后的结果存入文件(注意,一篇文章占一行),给出的文件中有训练数 Ĵ据集的例子,名字叫做tempTrain.txt

2.使用给出的代码训练即可,代码有注释

About

使用doc2vec生成句子,段落或者文章的向量,以便查找其之间的相似性

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages