推荐的学习书单:
1. 《统计学习基础:数据挖掘、推理与预测》
- 尽管应用的是统计学 *** ,但强调的是概念,而不是数学。
- 该书内容广泛,涵盖从有指导的学习(预测)到无指导的学习;从神经 *** 、支持向量机到分类树、提升等主题,应有尽有,许多例子还附以彩图,是同类书籍中介绍最全面的。
- 计算和信息技术的飞速发展带来了医学、生物学、财经和市场营销等诸多领域的海量数据。
- 理解这些数据是一种挑战,这导致了统计学领域新工具的发展,并延伸到诸如数据挖掘、机器学习和生物信息学等新领域。
2. 《模式分类》第二版
- 除了保留了第1版的关于统计模式识别和结构模式识别的主要内容以外,读者将会发现新增了许多近25年来的新理论和新 *** ,其中包括神经 *** 、机器学习、数据挖掘、进化计算、不变量理论、隐马尔可夫模型、统计学习理论和支持向量机等。
3. 《推荐系统实践》
- 过大量代码和图表全面系统地阐述了和推荐系统有关的理论基础,介绍了评价推荐系统优劣的各种标准(比如覆盖率、满意度)和 *** (比如AB测试),总结了当今互联网领域中各种和推荐有关的产品和服务。
4. 《深入搜索引擎–海量信息的压缩、索引和查询》
- 理论和实践并重,深入浅出地给出了海量信息数据处理的整套解决方案,包括压缩、索引和查询的方方面面,其更大的特色在于不仅满足信息检索理论学习的需要,更重要的是给出了实践中可能面临的各种问题及其解决 *** 。
5. 《概率论与数理统计》
- 这本书不用过多介绍了吧,普遍大学里大一时期的教科书,只恨当年没听课啊,现在正在慢慢啃。
6. 《大数据:互联网大规模数据挖掘与分布式处理》
- 主要包括分布式文件系统、相似性搜索、搜索引擎技术、频繁项集挖掘、聚类算法、广告管理及推荐系统。
7. 《Web数据挖掘》
- 信息检索领域的书籍,该书深入讲解了从大量非结构化Web数据中提取和产生知识的技术,书中首先论述了Web的基础(包括Web信息采集机制、Web标引机制以及基于关键字或基于相似性搜索机制),然后系统地描述了Web挖掘的基础知识,着重介绍基于超文本的机器学习和数据挖掘 *** ,如聚类、协同过滤、监督学习、半监督学习,最后讲述了这些基本原理在Web挖掘中的应用。《Web数据挖掘》为读者提供了坚实的技术背景和最新的知识。
8. 《数据之巅》
- 对大数据追根溯源,提出当前信息技术的发展,已经让中国获得了后发优势,中国要在大数据时代的全球竞争中胜出,必须把大数据从科技符号提升成为文化符号,在全社会倡导数据文化。
9. 《深入浅出统计学》
- 本书涵盖的知识点包括:信息可视化、概率计算、几何分布、二项分布及泊松分布、正态分布、统计抽样、置信区间的构建、假设检验、卡方分布、相关与回归等等,完整涵盖AP考试范围。
10. 《矩阵分析》
- 本书从数学分析的角度论述矩阵分析的经典 *** 和现代 *** ,取材新,有一定的深度,并给出在多元微积分、复分析、微分方程、量优化、逼近理论中的许多重要应用,主要内容包括:特征值、特征向量和相似性,酉等价和正规矩阵,标准形,Hermite矩阵和对称矩阵,向量范数和矩阵范数,特征值和估计和扰动,正定矩阵,非负矩阵。
11. 《统计学习 *** 》
- 本书全面系统地介绍了统计学习的主要 *** ,特别是监督学习 *** ,包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与更大熵模型、支持向量机、提升 *** 、em算法、隐马尔可夫模型和条件随机场等,除第1章概论和最后一章总结外,每章介绍一种 *** ,叙述从具体问题或实例入手,由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习 *** 的实质,学会运用,为满足读者进一步学习的需要,书中还介绍了一些相关研究,给出了少量习题,列出了主要参考文献。
12. 《机器学习导论》
- 对机器学习的定义和应用实例进行了介绍,涵盖了监督学习,贝叶斯决策理论,参数 *** 、多元 *** 、维度归约、聚类、非参数 *** 、决策树,线性判别式、多层感知器,局部模型、隐马尔可夫模型,分类算法评估和比较,组合多学习器以及增强学习等。
`《机器学习及其应用》:全书共分14章,内容涉及因果推断、流形学习与降维、迁移学习、类别不平衡学习、演化聚类、多标记学习、排序学习、半监督学习等技术和协同过滤、社区推荐、机器翻译等应用,以及互联网应用对机,`
希望这些调整对你有所帮助!如果你有任何其他问题,请随时告诉我。