统计流形扩散核的文本分类方法 | |
李侃 ; 周世斌 ; 刘玉树 | |
2015-09-10 ; 2015-09-10 | |
关键词 | 统计流形 扩散核 Dirichlet分布 文本分类 |
中文摘要 | 提出Dirichlet混合多项式(DCM)流形,并利用DCM流形可与正半球流形建立同胚和等距关系的性质,通过拉回映射将正半球流形的测地距离映射为DCM流形的测地距离,从而在DCM流形上建立距离度量,构建统计流形上的Dirichlet混合多项式扩散核和Dirichlet混合多项式倒排文档频率(DCMIDF)扩散核.利用WebKB Top4和20 Newsgroups语料库上进行实验,DCM流形能比欧氏空间更能准确地描述文本.与多项式核支持向量机算法、,负测地距离核支持向量机算法相比,实验结果显示文中基于DCM扩散核和DCMIDF扩散核的支持向量机算法可取得良好的文本分类效果. |
内容类型 | 期刊论文 |
源URL | [http://ir.calis.edu.cn/hdl/232060/14082] |
专题 | 中国矿业大学(徐州) |
推荐引用方式 GB/T 7714 | 李侃,周世斌,刘玉树. 统计流形扩散核的文本分类方法[J],2015, 2015. |
APA | 李侃,周世斌,&刘玉树.(2015).统计流形扩散核的文本分类方法.. |
MLA | 李侃,et al."统计流形扩散核的文本分类方法".(2015). |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论