CORC  > 中国矿业大学(徐州)
统计流形扩散核的文本分类方法
李侃 ; 周世斌 ; 刘玉树
2015-09-10 ; 2015-09-10
关键词统计流形 扩散核 Dirichlet分布 文本分类
中文摘要提出Dirichlet混合多项式(DCM)流形,并利用DCM流形可与正半球流形建立同胚和等距关系的性质,通过拉回映射将正半球流形的测地距离映射为DCM流形的测地距离,从而在DCM流形上建立距离度量,构建统计流形上的Dirichlet混合多项式扩散核和Dirichlet混合多项式倒排文档频率(DCMIDF)扩散核.利用WebKB Top4和20 Newsgroups语料库上进行实验,DCM流形能比欧氏空间更能准确地描述文本.与多项式核支持向量机算法、,负测地距离核支持向量机算法相比,实验结果显示文中基于DCM扩散核和DCMIDF扩散核的支持向量机算法可取得良好的文本分类效果.
内容类型期刊论文
源URL[http://ir.calis.edu.cn/hdl/232060/14082]  
专题中国矿业大学(徐州)
推荐引用方式
GB/T 7714
李侃,周世斌,刘玉树. 统计流形扩散核的文本分类方法[J],2015, 2015.
APA 李侃,周世斌,&刘玉树.(2015).统计流形扩散核的文本分类方法..
MLA 李侃,et al."统计流形扩散核的文本分类方法".(2015).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace