학술논문

基于双层树状支持向量机的观点挖掘与倾向分析 / View mining and trend analysis based on double-layer tree Support Vector Machine
Document Type
Academic Journal
Source
智能计算机与应用 / Intelligent Computer and Applications. 11(3):44-47
Subject
商品评论
网络爬虫
SVM
LSTM
情感分类
数据挖掘
Language
Chinese
ISSN
2095-2163
Abstract
本文通过进行大量预处理工作,将经过词袋模型和Word2Vec两种不同向量化方法处理后的文本数据分别输入到SVM和LSTM模型中,训练出可以识别文本情感倾向的模型.进而对新产生的评论进行分类.根据实际数据量的倾斜状况,基于传统机器学习算法支持向量机(SVM),本文提出双层支持向量机,采用2种不同的方法分别训练模型并预测.最后再使用深度学习算法长短时记忆模型(LSTM)再次训练并预测,并对这3种方法做出比较和总结.结果显示,双层SVM比单层SVM的准确度提高了8个百分点;而LSTM比单层SVM低了2个百分点,比双层SVM低了接近10个百分点.