翟俊海

数据约简 : 样例约简与属性约简.pdf

数据约简包括样例约简和属性约简,是从不同角度对数据进行约简。本书在分类的框架下介绍数据约简的方法。重点介绍了确定性与不确定性环境下的样例约简方法和属性约简方法,样例约简方法包括交叉选择样例算法、压缩模糊K近邻规则方法、概率神经网络样例选择算法、属性约简方法包括最小相关性最大依赖度

面向数据挖掘的算法设计与分析.pdf

  本书以数据挖掘为应用载体,按应用频率的高低,系统地介绍分治算法、贪心算法、搜索算法和动态规划算法。同时,介绍算法分析所用的渐近符号及常用的分析方法,包括递归分析方法、非递归分析方法。本书的特点是结合作者及其团队研究的数据挖掘问题,注重介绍算法的基本思想及算法应用的启发性。

基于不确定性的决策树归纳.pdf

本书主要介绍不确定性及不确定环境下的决策树归纳方法,包括模糊决策树归纳、最优割点的模糊化处理、决策树优化、主动学习与特征选择在模糊决策树中的应用、模糊决策树的集成学习等内容。

Hadoop/Spark大数据机器学习.pdf

人类已进入大数据时代。大数据是指具有海量(volume)、多模态(variety)、变化速度快(velocity)、蕴含价值高(value)和不精确性高(veracity)“5V”特征的数据。大数据给传统的机器学习带来巨大的挑战,已引起学术界和工业界的高度关注。Hadoop和Sp