基于真值发现的加油站车辆号牌缺损数据填充方法
彭新亮; 程力; 王轶; 马博; 赵凡; 周喜
刊名计算机应用与软件
2019
卷号36期号:8页码:41-46+74
关键词数据清洗 车辆加油数据 缺失数据填充 真值发现
ISSN号1000-386X
英文摘要

由于数据采集设备的不完善以及数据在传输过程中的不可靠性等原因,致使加油站车辆加油数据中经常会产生数据的丢失和错误,降低了车辆加油数据的完整性,严重影响了后续的数据分析工作。目前虽然已有许多算法可以解决连续型数值数据的缺损问题,但是它们并不适用于车辆号牌这种离散型分类数据。提出一种基于改进TruthFinder算法的缺损值填充框架。基于真值发现算法,考虑到离散数据相似度的计算方式,改进原算法对数据值支持度的计算模型。通过在真实加油站车辆数据集上的实验,相较于原算法及更加通用的Voting算法,正确率分别提升了7%和23%。该方法能部分解决类似加油站车辆加油数据这种多源离散型数据的缺损值填充问题,大大提高了此数据的可用性。

内容类型期刊论文
源URL[http://ir.xjipc.cas.cn/handle/365002/7115]  
专题新疆理化技术研究所_多语种信息技术研究室
作者单位1.新疆理化技术研究所新疆民族语音语言信息处理实验室
2.中国科学院大学
3.中国科学院新疆理化技术研究所
推荐引用方式
GB/T 7714
彭新亮,程力,王轶,等. 基于真值发现的加油站车辆号牌缺损数据填充方法[J]. 计算机应用与软件,2019,36(8):41-46+74.
APA 彭新亮,程力,王轶,马博,赵凡,&周喜.(2019).基于真值发现的加油站车辆号牌缺损数据填充方法.计算机应用与软件,36(8),41-46+74.
MLA 彭新亮,et al."基于真值发现的加油站车辆号牌缺损数据填充方法".计算机应用与软件 36.8(2019):41-46+74.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace