贝叶斯优化在垃圾邮件过滤中的应用研究
韩雪
2023-06-30
发表期刊徐州工程学院学报(自然科学版)
ISSN1674-358X
卷号38期号:02页码:77-83
摘要朴素贝叶斯算法利用数据的先验概率计算出后验概率,现在已成为机器学习中流行的文本分类算法,在邮件分类中具有良好的垃圾邮件过滤效果,但朴素贝叶斯算法受属性独立性与重要性一致的假设限制,没有考虑特征词在各类别间的分布,邮件样本中条件依赖性不足等问题导致分类精度不高.鉴于贝叶斯优化在自然语言处理方面已经广泛应用,采用信息增益技术对贝叶斯进行优化,引入词语权重及信息增益的概念,提出了一种基于权重的贝叶斯分类模型,把信息增益应用到词语在各个类的分布比例权重.将信息增益权重计算方法用于改进向量空间模型(VSM)的特征权重计算,并将之应用于改进朴素贝叶斯算法来进行邮件分类,通过在中英文邮件测试集上的实验,证明了改进的算法相比于传统邮件过滤方法,其分类精度和准确率有了显著提高.
关键词邮件过滤 信息增益 向量空间模型 贝叶斯优化 机器学习
DOI10.15873/j.cnki.jxit.000514
URL查看原文
语种中文
原始文献类型学术期刊
文献类型期刊论文
条目标识符http://ir.library.ouchn.edu.cn/handle/39V7QQFX/167430
专题国家开放大学江苏分部
作者单位徐州开放大学信息工程学院
第一作者单位国家开放大学江苏分部
第一作者的第一单位国家开放大学江苏分部
推荐引用方式
GB/T 7714
韩雪. 贝叶斯优化在垃圾邮件过滤中的应用研究[J]. 徐州工程学院学报(自然科学版),2023,38(02):77-83.
APA 韩雪.(2023).贝叶斯优化在垃圾邮件过滤中的应用研究.徐州工程学院学报(自然科学版),38(02),77-83.
MLA 韩雪."贝叶斯优化在垃圾邮件过滤中的应用研究".徐州工程学院学报(自然科学版) 38.02(2023):77-83.
条目包含的文件
条目无相关文件。
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[韩雪]的文章
百度学术
百度学术中相似的文章
[韩雪]的文章
必应学术
必应学术中相似的文章
[韩雪]的文章
相关权益政策
暂无数据
收藏/分享
相关推荐
大连市农村社保体系问题及对策分析
积极学业情绪与学习动机——基于外语远程开放学习情感因素的研究
计算机软件人才培养模式的分析与思考
Web数据库在Classmate book中的应用
网络环境下的实用型CAPP系统的研究与设计
基于儒家思想的体育文化国际交流探析
多元智能视角下的英语远程教学
辍学对远程教育成本效益影响的研究
人力资本投资视角的远程教育辍学问题分析
兼顾开放教育大小专业平衡发展的思考——基于学科与专业辍学率的统计与探究
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。