文章摘要
大数据中基于稀疏投影的在线特征选择算法
  
DOI:
中文关键词: 在线学习  截断技术  稀疏投影  特征选择  在线平均错误率  大数据挖掘
英文关键词: 
基金项目:广西高校科学技术研究资助项目(2013LX143)
作者单位
张自敏* 贺州学院 教育技术中心,广西 贺州 542899 
摘要点击次数: 1728
全文下载次数: 0
中文摘要:
      大多数在线学习研究要求访问训练实例的所有属性/特征.这一典型要求在大数据应用中难以满足,因为数据实例的维度可能很高,为了获得完整的属性/特征集而访问所有属性/特征时的成本太高.针对这一问题,首先利用截断技术提出改进的Perceptron算法用于在线特征选择,然后针对该算法错误率较高的缺点,提出一种基于稀疏投影的在线特征选择算法(OFS),并给出了OFS算法误差边界的理论分析.最后基于多种公开数据集的实验结果表明,本文算法的在线平均错误率和时间效率等方面性能要优于著名的批特征选择算法,在大规模应用中具有广阔前景.
英文摘要:
      
查看全文   查看/发表评论  下载PDF阅读器
关闭