| 基于类别的CHI特征选择方法 |
| 梁伍七; 李斌; 许磊
|
| 2015-09-20
|
发表期刊 | 安徽广播电视大学学报
 |
ISSN | 1008-6021
|
卷号 | No.170期号:03页码:124-128 |
摘要 | 文本分类问题中,卡方特征选择是一种效果较好的特征选择方法。计算单词的卡方值时,先计算单词针对每个类别的卡方值,再通过类别概率将卡方值调和平均,作为单词相对于整个训练集合的卡方值,这种全局方法忽视了单词和类别间的相关性。针对这一问题,提出基于类别的卡方特征选择方法。基于类别的方法针对每个类别遴选特征词,特征词数量根据事先设定的阈值、类别的文档数和整个训练集合文档数计算得到,不同类别的特征空间可能包含相同的特征词。采用KNN分类方法,将基于类别的方法与全局方法进行比较,实验结果表明,基于类别的方法能够提高分类器的总体性能。 |
关键词 | 文本分类
卡方
特征选择
特征词
KNN分类
|
DOI | 10.19371/j.cnki.issn1008-6021.2015.03.028
|
URL | 查看原文
|
语种 | 中文
|
原始文献类型 | 学术期刊
|
文献类型 | 期刊论文
|
条目标识符 | http://ir.library.ouchn.edu.cn/handle/39V7QQFX/65800
|
专题 | 国家开放大学安徽分部
|
作者单位 | 安徽广播电视大学信息与工程学院
|
第一作者单位 | 国家开放大学安徽分部
|
第一作者的第一单位 | 国家开放大学安徽分部
|
推荐引用方式 GB/T 7714 |
梁伍七,李斌,许磊. 基于类别的CHI特征选择方法[J].
安徽广播电视大学学报,2015,No.170(03):124-128.
|
APA |
梁伍七,李斌,&许磊.(2015).基于类别的CHI特征选择方法.安徽广播电视大学学报,No.170(03),124-128.
|
MLA |
梁伍七,et al."基于类别的CHI特征选择方法".安徽广播电视大学学报 No.170.03(2015):124-128.
|
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论