人才紧缺:能将模型应用于专业领域的人,也就是跨领域让机器学习落地的人
如果有足够的机器学习知识,并对特定领域有良好的理解,在职场供求中肯定可以站在优势的那一边 能写代码、构建模型的人千千万,但理解自己在做什么,并从中结合自己的领域知识提供商业价值的人少之又少
没有太大的必要通晓数学,擅长优化。就是大部分人不要造轮子,不要造轮子。 理解自己在做什么,知道选择什么模型,直接调用API或者现有的工具即可。
回归模型:回归才是工业界最常见的模型。目前流行以数为模型的xgboost,预测效果很好还可以对变量重要性进行自动排序。 传统的线性回归(一元和多元)也还会继续流行下去,因为其良好的可解释性和低运算成本。
分类模型:应该对现有流行并将继续流行下去的模型有深刻的了解。随机森林和支持向量机(svm)。逻辑回归依然用的最多。(统计学习方法)
神经网络:抓经典,掌握基本的三套网络。 a:普通的ANN b:处理图像的CNN c:处理文字语音的RNN(LSTM). 对于每个基本的网络只要了解经典的处理方式即可(吴恩达课程)
数据压缩/可视化:工业界常见的就是先对数据进行可视化。高维数据压缩到2维或者3维可以很快看到一些有意思的事情,可能能节省大量的时间。学习可视化可以使用现成的工具。
无监督学习和半监督学习:大量数据缺失,一般都需要使用大量的无监督,或者半监督学习来利用有限的标签进行学习。
基本功的意义是当你面对具体问题的时候,你很清楚可以用什么武器来处理。
有基本功, 必须要结合领域知识, 不能盲目转机器学习从零开始。结合自己感兴趣的领域开始。
已经工作的人,要试着将自己的工作经历利用起来。对特定领域的深刻理解往往就是捅破窗户的那最后一层纸。只理解模型但不了解数据背后的意义,导致很多机器学习模型好看不好用。 各行各业从业者不必盲目的转计算机或者机器学习,而应该加深对本专业的了解并自学补偿基本功,成为这个领域的机器学习专家。
尽量关注,学习了解已经成熟和已有实例的新二点,不必凡热点都追。
本文根据知乎未来 3~5 年内,哪个方向的机器学习人才最紧缺?答案摘录整理,如有侵权,请告知立刻删除。