开源!《AI 算法工程师手册》中文教程正式发布!

作者 | 红色石头
转载自 AI有道(id:redstonewill)
最近红色石头在浏览网页的时候,偶然发现一份非常不错的 AI 资源,就是这本《AI 算法工程师手册》 。本文将给大家推荐这本优秀教材,并作详细的介绍。
这本《AI 算法工程师手册》已正式开源,无需购买纸质书籍,可以直接在线阅读,体验感爆棚。在线阅读地址为:
http://www.huaxiaozhuan.com/
作者简介
首先不得不提一下本书的作者,作者华校专,曾经在阿里巴巴担任资深算法工程师,现任智易科技首席算法研究员。他还是《Python 大战机器学习》书籍的作者。
书籍介绍
这本《AI 算法工程师手册》是作者多年以来学习总结的笔记,经整理之后开源于世。关于为什么将完整书籍开源,作者是这样说的:曾有出版社约稿,但是考虑到出版时间周期较长,而且书本购买成本高不利于技术广泛传播,因此就采取开源的形式。
既然本书是 AI 算法工程师的手册,因此内容非常丰富,基本涵盖了机器学习、深度学习等领域的很多重要理论知识和实战经验,同时也介绍了工程应用中经常使用的 AI 工具和编程库。
书籍整体包含了 5 大块内容,分别是:
数学基础
统计学习
深度学习
自然语言处理
工具
下面我们分别来看一下各模块的内容。
1. 数学基础
提升 AI 内功心法离不开扎实的数学基础。本书数学基础这部分,作者主要介绍了最重要的 4 点:
1. 线性代数基础?
2. 概率论基础
3. 数值计算基础?
4. 蒙特卡洛方法与 MCMC 采样?
例如线性代数部分最基本的基础知识:

2. 统计学习
这部分内容作者花了比较大的篇幅,主要介绍的是机器学习中一些常见的算法,包括线性回归、感知机、支持向量机、决策树、集成学习等。同时还包括模型评估、特征选择、降维等。具体内容如下:
0. 机器学习简介?
1. 线性代数基础?
2. 支持向量机?
3. 朴素贝叶斯
4. 决策树
5. knn?
6. 集成学习?
7. 梯度提升树
8. 特征工程?
9. 模型评估
10. 降维?
11. 聚类?
12. 半监督学习?
13. EM算法?
14. 最大熵算法
15. 隐马尔可夫模型
16. 概率图与条件随机场
17. 边际概率推断
每个算法的理论介绍非常详细、数学推导完整,例如支持向量机中关于对偶问题的推导:



3. 深度学习
这部分主要介绍深度学习神经网络的基本知识和模型,包括前馈神经网络、卷积神经网络、循环神经网络等。具体内容如下:
0. 深度学习简介
2. 反向传播算法
3. 正则化
4. 最优化基础
5. 卷积神经网络
6. 循环神经网络
7. 工程实践指导原则
这部分详细介绍了神经网络模型的基本结构和训练方法,例如列举了经典 CNN 结构:LeNet、AlexNet、VGG-Net、Inception、ResNet、ResNet 变种、SENet、DenseNet。

1998 年 LeCun 推出的 LeNet 网络
4. 自然语言处理
这部分作者主要介绍了自然语言处理领域的 2 个方面:
1. 主题模型?
Unigram Model?
pLSA Model?
LDA Model?
型讨论?
2. 词向量?
向量空间模型 VSM?
LSA?
Word2Vec?
GloVe
5. 工具
这部分主要介绍了 AI 常用工具和函数库,具体内容如下:
1. CRF
2. lightgbm
3. xgboost
4. scikit-learn
5. spark
6. numpy
7. scipy
8. matplotlib
9. pandas
这部分的内容更加侧重于 AI 实战,包含很多具体函数库的使用教程和代码。例如 lightbgm 是一个快速的,分布式的,高性能的基于决策树算法的梯度提升框架。可用于排序,分类,回归以及很多其他的机器学习任务中。本书对 lightbgm 的安装、各参数含义、调参、使用等都作了详细的介绍,宛如一份优秀的中文文档!
这里附上 lightbgm 简单的 pip 安装方法:
pip?install lightgbm
pip install --no-binary :all: lightgbm?#从源码编译安装
pip install lightgbm --install-option=--mpi?#从源码编译安装 MPI 版本
pip install lightgbm --install-option=--gpu?#从源码编译安装 GPU 版本
pip install lightgbm --install-option=--gpu --install-option="--opencl-include-dir=/usr/local/cuda/include/"?--install-option="--opencl-library=/usr/local/cuda/lib64/libOpenCL.so"?#从源码编译安装,指定配置
#可选的配置有:
# boost-root
# boost-dir
# boost-include-dir
# boost-librarydir
# opencl-include-dir
# opencl-library
同样,像 xgboost、scikit-learn 等库,书中也作了详尽的解释。除此之外,还有 spark 的内容哦,可以说是非常全面了。
最后
不得不说,这本《AI 算法工程师手册》是一本比较完备的 AI 书籍,既包含了算法理论,也有实战 AI 算法库的使用。作为一份参考手册还是非常不错的!
更重要的是本书完全开源,直接在线阅读就好了。不过注意该书籍仅供个人学习使用,非作者同意不得应用于商业领域。
(本文为 AI科技大本营转载文章,转载请联系原作者)
◆
CTA核心技术及应用峰会
◆
5月25-27日,由中国IT社区CSDN与数字经济人才发展中心联合主办的第一届CTA核心技术及应用峰会将在杭州国际博览中心隆重召开,峰会将围绕人工智能领域,邀请技术领航者,与开发者共同探讨机器学习和知识图谱的前沿研究及应用。
更多重磅嘉宾请识别海报二维码查看,目前会议早鸟票发售中(原票价1099元),点击阅读原文即刻抢购。添加小助手微信15101014297,备注“CTA”,了解票务以及会务详情。

推荐阅读

关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
- 1 打好关键核心技术攻坚战 7904124
- 2 在南海坠毁的2架美国军机已被捞出 7808818
- 3 立陶宛进入紧急状态 卢卡申科发声 7711869
- 4 持续巩固增强经济回升向好态势 7617524
- 5 多家店铺水银体温计售空 7520493
- 6 奶奶自爷爷去世9个月后变化 7425800
- 7 穷滑的年轻人把中产滑雪拉下神坛 7331387
- 8 日舰曾收到中方提示 7236237
- 9 仅退款225个快递女子已归案 7136499
- 10 我国成功发射遥感四十七号卫星 7043297







AI100
