张素芳

面向数据挖掘的算法设计与分析.pdf

  本书以数据挖掘为应用载体,按应用频率的高低,系统地介绍分治算法、贪心算法、搜索算法和动态规划算法。同时,介绍算法分析所用的渐近符号及常用的分析方法,包括递归分析方法、非递归分析方法。本书的特点是结合作者及其团队研究的数据挖掘问题,注重介绍算法的基本思想及算法应用的启发性。

Hadoop/Spark大数据机器学习.pdf

人类已进入大数据时代。大数据是指具有海量(volume)、多模态(variety)、变化速度快(velocity)、蕴含价值高(value)和不精确性高(veracity)“5V”特征的数据。大数据给传统的机器学习带来巨大的挑战,已引起学术界和工业界的高度关注。Hadoop和Sp