「资深」AI算法工程师的一次全面的年终总结
Python to AI
[前序:]大概整理了两个月之久,结合了自身做算法经验,以及各大企业目前关于人工智能方向的应用需求,总结了一份适合全面掌握以python语言为基础的数据挖掘,机器学习,深度学习的进阶路线,网上的资料也是铺天盖地,有大量支持国外的课程和书籍,也有很多人写了关于商业性质的速成强心剂。但是小编觉得,凡是你要抓住你自身的需求,其次是您的优势。从小白到大神一直是一个我非常不喜欢的词语。所以没必要去浪费那么多的时间。但是基础也是需要的,但是你所有的基础都是为接下来的应用做好铺垫工作,承上很重要。当然python也是一个极具功能性的东西,以至于一些小玩意的程序都会受到追捧,其实这些对我们的工作性质并起不到太大作用,学习一门语言其实只是一个开端,与之交融的更上层建筑才是我们的工作指向。所以在学习python之前,你要一个适合自己的路线,在前期多花一些时间去做一个资料收集和对比,给自己制定一个学习路线是很有必要的。
可能很多人都在每天去寻找各种资源去学习最新的东西,有次听朋友说,一群考上研究生的学生去选择导师,当导师问起你们想做什么的时候,90%的人说我想做机器学习,当老师问他们什么是机器学习的时候,居然没有一个人能实质上回答上来。很多人说人工智能这个行业火的原因是因为alphaGo的出现,被商业人士进行各种包装,商业性质的推动,而实质上我们看了很多大学教授和院士在讲解自动驾驶的讲座中,他们总会说到,...还有很长的路要走。所以真正的人工智能无需人参与的情景目前还不存在。
你的目标很重要:有的人是仅仅想使用python的基础功能做数学运算,有的人是想使用python做网络数据爬虫,有些人想通过python去做机器学习,数据分析,深度学习,然后衍生到各个领域,这些都是你的自己需要设计的大目标。目标和计划很重要,小编也是一直拖了很久,怕有什么不完善,但是大多数时间还是不想去总结。但是2019年都快剩下不到一周的时间,还是给自己的2020年做个技术上的时间和目标规划。重新捡起写代码的兴趣,给自己的工作技能做一些实效性的规划。
PS: 文章很长,绝对硬货,保证你要有时间读完。
一、内容概要
1. 章节设置
章节共分为7章,不是为了什么就业、拿offer这些功名之类的啊,再次强调如果内心想什么:"速成","一天搞定...","从零...",这些的就不用看了。我可能写这些更多是因为自身的经验来描述一下自己关于一个人工智能工程师的完善要求和目标来制定的计划。
- 第一章: python 学习路线
- 第二章: Math 学习路线
- 第三章: Data Science 学习路线
- 第四章: Machine Learning 学习路线
- 第五章: Deep Learning 学习路线
- 第六章: 人工智能综述
- 第七章: 企业岗位需求和时下热门技术跟进
2. 每章内容结构
针对于整个进阶的思路我分成了以上7个模块,每个模块独立而且是递进的,区分模块化的意义在于是担心自己在复习的过程中陷入某个模块太久,以至于不能权衡自己的整个知识体系的学习与掌握。会浪费很多的时间,模块的同时方便给自己制定时间。再次对每章内容的安排以只上硬货为主,直接是自己一路走来和结合一些身边的人的学习路线。主要以书籍和编程实战为主。
(1)学习路线概览
(2)模块学习方法
(3)模块学习资源
(4)检验学习成果
(5)学习时间规划
二、Python 进阶路线
1 学习路线概览
由于选择的路线的终点是深度学习,要做好一个深度学习的专家,主要是两个模块:数据+模型。缺一不可。深度学习的研发人员有70%的时间都是在做数据分析和数据挖掘。因此学习python的主要路线是为做数据分析。在此我们分为两部分:python基础和python应用库。
1.1 Python 基础路线
1.2 知识解析
- 编程风格: 学习一门新的语言,首先要学编程规范,这个我就不用多说了吧。不要自己写的程序,日后自己看不懂,或者让别人看着恶心。Google的编码风格,可以在文末链接里下载。
- 基础必备: 还是建议学习手册吧。如果想学的全面一点,之前有其他语言基础的,或者学过matlab的,这种语言很简单就看完了。其他的书籍可能就不全面。只针对应用写一些python基础。具体视大家的需求而来。
- 编程进阶: 这个就涉及到接近项目的问题组合了,更加了解python在处理问题时的逻辑。是一个介于基础知识和项目之间的桥梁书籍。
- 编程优化: 这个第四步是一直持续到你使用python做开发的整个过程中的,编程的优化,项目的优化与部署,以及编程所面临的一些底层的问题。功能成功只是第一目标,最终的算法性能才是决定python的掌握程度。
- 项目实战: 这里只是简单说一下项目选择的问题,还是建议大家不要再从都用烂大街的项目:打飞机,泰坦尼克号之类的,没用的,最好是去实施一些比较好的应用项目。这里的项目我也给自己总结了一些,存在三个大方向:
- 数据爬虫
- Python Web开发
- Python 数据处理
具体的项目的也有所总结,可以在文末下载。
好好先生:大数据应该具备的10种机器学习方法zhuanlan.zhihu.com
2. Python 应用库学习方法
基于python开发了很多应用库和应用框架。这是我们向应用进阶的开始,下面简单罗列一下一些具体的库和应用方向。作为选择学习的依据。以及参考方向。针对人工智能和大数据方向的模块库。
学习方法: 先去学习数据分析三剑客,然后针对数据分析领域尝试相关项目,学习数据分析库的时候要学会彼此互相对比,这个在国外的博客上做的是最好的。
好好先生:Pandas 操作数据集(最全总结之一)zhuanlan.zhihu.com
好好先生:机器学习numpy库的最全运用zhuanlan.zhihu.com
好好先生:Python中机器学习的Numpy指南zhuanlan.zhihu.com
所有库的总结可以在文后下载。
3. Python 学习资源
首先是自己的知乎收藏夹:
机器学习zhihu.com
其次是书籍的分类(基础,进阶,实战,交叉):
项目工程类:
视频教程类:
相关博客和网站链接:
4. Python 学习检验
通过python的学习去部署项目,优化项目,提交项目到自己的数据仓库或者github上。对每个项目首先要实现重现。学会模块间同样功能的对比和替换,找出优势劣势。
三、Math 进阶路线
吐槽:当下的AI是一个技术交叉融合的技术,正是因为其中有了数学这一分支,才让每天在github上都有新花样,让人破解的费劲。与其追那些东西,还不如踏踏实实把数学学好,其实对于一些干货知识是没有任何捷径的,也别想快乐的用各种花里胡哨的东西去帮助自己学习,你不喜欢,你没动力再好的方法也没有用。人的抗拒心理是哄不好的。这里主要针对AI所用到的应用数学做出一些建议:
1 学习路线概览
1.1 Math 基础路线
在此对数学的基础分支做出四个方面的总结:数学分析(微积分),高等代数(线性代数),概率论与信息化(统计学模型与分布),数值分析(计算数学:插值优化)。如图:
1.2 Math 知识解析
如果想对数学有更深的认知的爱好者可以看看之前对运筹学专业的解析:
好好先生:数学系|运筹学和控制论(序论)zhuanlan.zhihu.com
王源:【学界】一文读懂机器学习需要哪些数学知识(附全套优秀课程的网盘链接资源)zhuanlan.zhihu.com
1.3 Machine Learning 与 Math 的联系
数学知识还是建议先厚后薄,学完数学知识以后,可以结合Math与机器学习每一部分的关联性书籍,大致巩固和梳理自己的数学储备,查漏补缺。
红色石头:机器学习数学全书,1900 页 PDF 下载zhuanlan.zhihu.com
2 Math 学习资源
2.1 书籍力推
依然看书为主:【在精不在多】
数学分析和高等代数书籍不限,当然也可以根据慕课的大学课程去找对应的书籍。
中国大学MOOC(慕课)_国家精品课程在线学习平台icourse163.org
推荐一下:
这里主要针对概率论进行相关书籍推荐:
(有自己的网站!!)
2.2 网站推荐
2.2.1 知乎高赞的数学仿真网站
线性代数和微积分的讲法很好很形象适合初学者
maoooo:我在B站学数学zhuanlan.zhihu.com
2.2.2 囊括数学的基本所有学科的在线知识库和仿真计算器
Wolfram|Alpha: Making the world’s knowledge computablewolframalpha.com
2.2.3 博士乐园(国内少之又少的平台,要会员费)
博士家园 - 数学学科交流学术网站math.org.cn
2.3 Math软件推荐(三选其一就好,专业制图和科学计算)
1)wxMaxima
2)Matlab
3)Orgin
2.4 Math 进阶检验
1)看书
通过看深度学习和机器学习相关书籍的前几章。总结关联!!
2) python 模块学习
通过学习python相关领域的模块进行数学知识的巩固和衔接
前面介绍python的时候已经举例过很多库
四、 Data Science 进阶路线
1 学习路线概览
人工智能的最重要的一部分就是数据,前期大部分时间都是用在数据的采集和样本的归类清洗标记上,同时机器学习的其中的一种分支应用就是大数据,何为大数据以及何为数据科学家,在此做一个总结,看下图。
1.1 DataCamp
在DataCamp上我们能看到关于大数据分析的几乎所有内容以及教学课程。而且具备自身的Ipython平台,简化编程环境。
因为数据科学的衍生应用有很多,所以这里给出一篇关于数据科学的学习路线
https://towardsdatascience.com/the-best-data-science-learning-resources-out-there-and-my-journey-into-data-science-81c5a6ec67bctowardsdatascience.com
主网站:
https://datacamp.comdatacamp.com
相关具体网站分支:
DATA ANALYST WITH PYTHON:
https://datacamp.com/tracks/data-analyst-with-pythondatacamp.com
PYTHON PROGRAMMER:
https://datacamp.com/tracks/python-programmerdatacamp.com
IMPORTING & CLEANING DATA WITH PYTHON:
https://datacamp.com/tracks/importing-cleaning-data-with-pythondatacamp.com
DATA MANIPULATION WITH PYTHON:
https://datacamp.com/tracks/data-manipulation-with-pythondatacamp.com
Introduction to Relational Databases in SQL:
https://datacamp.com/courses/introduction-to-relational-databases-in-sqldatacamp.com
Introduction to Shell for Data Science:
https://datacamp.com/courses/introduction-to-shell-for-data-sciencedatacamp.com
Conda Essentials:
https://datacamp.com/courses/conda-essentialsdatacamp.com
1.2 data Science Central
这是介绍数据科学的第二个比较权威的网站:Hadoop, BigData, Statistic, Analystics, DL, ML, AI
2 Data Science 进阶资源
2.1 python 大数据分析
视频资源:
链接:https://pan.baidu.com/s/1dt8Fm-Kasrp75RT6G_nx9Q 提取码:34xw
2.2 hadoop 数据挖掘
链接:https://pan.baidu.com/s/14lI6NuHLn01cQc2cddQiGg 提取码:dp6m
2.3 Data Science Note
链接:https://pan.baidu.com/s/1WF2schbXsMbhw5nKcK5ltg 提取码:5f9e
2.4 三大网站
https://towardsdatascience.com/towardsdatascience.com
Learn SQL - Free Interactive SQL Tutoriallearnsqlonline.org
Build software better, togethergithub.com
3 Data Science 进阶检验
项目为依托
五、Machine Learning 进阶路线
1 学习路线概览
好好先生:超过200种最佳机器学习,NLP和Python教程— 2019年版zhuanlan.zhihu.com
好好先生:Quora中关于机器学习和NLP的187个经典问题zhuanlan.zhihu.com
好好先生:Google精选100+的AI和机器学习资源清单(最全资源列表)zhuanlan.zhihu.com
2 Machine Learning 进阶资源
2.1 书籍推荐
2.2 Machine Learning 进阶检验
2.2.1 机器学习的数学模型和推导
2.2.2 机器学习的Web相关应用
2.2.3 Github的项目实践:数据挖掘
https://github.com/topics/data-mininggithub.com
六、 Deep Learning 进阶路线
1 学习路线概览
深度学习属于机器学习的分支,建立于网络之上:
1.1 深度学习与机器学习的联系
1.2 常用的深度学习网络模型
1.3 深度模型重要框架
1.4 深度学习开发流程
2 DeepLearning 进阶推荐
3 DeepLearning 进阶检验
Build software better, togethergithub.com
七、人工智能综述
八、 企业岗位需求和时下热门技术跟进
根据国内当下对机器学习的需求和应用,对相关岗位做出如下总结:
由于应用领域的分支不同,可能每个人终点不一样,但是起点大家都会是一样的。
本文所有思维导图的图片可以通过我的公众号回复【AI】免费下载。同时也希望和大家一起交流。
关于作者:官方公众号:从零归一