人工智能技术基础系列之(五):AI算法应用场景
将AI算法区分为二分类算法、多分类算法、回归算法、聚类算法和异常检测五种,对应到应用场景及解决任务:数据特征较多、线性模型、训练时间短、精准的场景、内存占用量大、预测事件次数、预测分布等。
@一图快速了解全文@
以下为详细内容→
01.二分类算法
(1)二分类支持向量机(Two-class SVM):适用于数据特征较多、线性模型的场景。
(2)二分类平均感知器(Two-class Average Perceptron):适用于训练时间短、线性模型的场景。
(3)二分类逻辑回归(Two-class Logistic Regression):适用于训练时间短、线性模型的场景。
(4)二分类贝叶斯点机(Two-class Bayes Point Machine):适用于训练时间短、线性模型的场景。
(5)二分类决策森林(Two-class Decision Forest):适用于训练时间短、精准的场景。
(6)二分类提升决策树(Two-class Boosted Decision Tree):适用于训练时间短、精准度高、内存占用量大的场景。
(7)二分类决策丛林(Two-class Decision Jungle):适用于训练时间短、精确度高、内存占用量小的场景。
(8)二分类局部深度支持向量机(Two-class Locally Deep SVM):适用于数据特征较多的场景。
(9)二分类神经网络(Two-class Neural Network):适用于精准度高、训练时间较长的场景。
02.多分类算法
解决多分类问题通常适用三种解决方案:第一种,从数据集和适用方法入手,利用二分类器解决多分类问题;第二种,直接使用具备多分类能力的多分类器;第三种,将二分类器改进成为多分类器以解决多分类问题。
常用算法
(1)多分类逻辑回归(Multiclass Logistic Regression):适用训练时间短、线性模型的场景。
(2)多分类神经网络(Multiclass Neural Network):适用于精准度高、训练时间较长的场景。
(3)多分类决策森林(Multiclass Decision Forest):适用于精准度高,训练时间短的场景。
(4)多分类决策丛林(Multiclass Decision Jungle):适用于精准度高,内存占用较小的场景。
(5)一对多多分类(One-vs-all Multiclass):取决于二分类器效果。
03.回归算法
回归问题通常被用来预测具体的数值而非分类。除了返回的结果不同,其他方法与分类问题类似。将定量输出,或者连续变量预测称为回归;将定性输出,或者离散变量预测称为分类。
常用算法
(1)排序回归(Ordinal Regression):适用于对数据进行分类排序的场景。
(2)泊松回归(Poission Regression):适用于预测事件次数的场景。
(3)快速森林分位数回归(Fast Forest Quantile Regression):适用于预测分布的场景。
(4)线性回归(Linear Regression):适用于训练时间短、线性模型的场景。
(5)贝叶斯线性回归(Bayesian Linear Regression):适用于线性模型,训练数据量较少的场景。
(6)神经网络回归(Neural Network Regression):适用于精准度高、训练时间较长的场景。
(7)决策森林回归(Decision Forest Regression):适用于精准度高、训练时间短的场景。
(8)提升决策树回归(Boosted Decision Tree Regression):适用于精确度高、训练时间短、内存占用较大的场景。
04.聚类算法
将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类的目标是发现数据的潜在规律和结构。聚类通常被用作描述和衡量不同数据源间的相似性,并把数据源分类到不同的簇中。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。
典型要求
可伸缩性、处理不同类型数据的能力、发现任意形状的聚类、用于决定输入参数的领域知识最小化、处理噪声数据的能力、对于输入记录的顺序不敏感、高维度、基于约束、可解释性和可用性。
常用算法
(1)层次聚类(Hierarchical Clustering):适用于训练时间短、大数据量的场景。
(2)K-means算法:适用于精准度高、训练时间短的场景。
(3)模糊聚类FCM算法(Fuzzy C-means,FCM):适用于精确度高、训练时间短的场景。
(4)SOM神经网络(Self-organizing Feature Map,SOM):适用于运行时间较长的场景。
05.异常检测
在数据挖掘中,异常检测是对不匹配预期模式或数据集中其他项目的项目、事件或观测值的识别。异常也被称为离群值、新奇、噪声、偏差和例外,分为单点异常、上下文异常和集体异常。应用场景包括且不限于:
金融领域:从金融数据中识别欺诈案例,如识别信用卡申请欺诈、虚假信贷等;
网络安全:从流量数据中找出入侵者,并识别新的网络入侵模式;
电商领域:从交易数据中识别恶意买家,如羊毛党、恶意刷屏团伙;
生态灾难预警:基于对风速、降雨量、气温等指标的预测,判断未来可能出现的极端天气;
工业界:可通过异常检测手段进行工业产品的瑕疵检测,代替人眼进行测量和判断。
无监督式异常检测
在假设数据集中大多数实例都是正常的前提下,无监督式异常检测方法能通过寻找与其他数据最不匹配的实例来检测出未标记测试数据的异常。
监督式异常检测
需要一个已经被标记正常与异常的数据集,并涉及到训练分类器(与许多其他的统计分类问题的关键区别是异常检测的内在不均衡性)。
半监督式异常检测
根据一个给定的正常训练数据集创建一个表示正常行为的模型,然后检测由学习模型生成的测试实例的可能性。
【声明】 本公众号转载和引用的文章仅作学习交流之用,不代表我们的观点。文章版权及插图属于原作者或/及其引用的原始来源,如版权存在争议,请联系我们,我们将第一时间处理。 |
关于仰山智库
仰山智库以聚焦国家安全,服务国家发展为使命,以中国视角,拓战略视野,聚制度视域。坚持学术平等、去行政化,鼓励百家争鸣,提倡定性定量分析方法相结合、国外研究与国情分析相结合、实证研究与规范研究相结合。重点围绕国家安全、战略管理、智库建设等主题,开展多元交流,汇集多方智慧,形成决策咨询建议、热点问题分析、智库观点集萃等成果,咨政建言,服务社会。
欢迎扫描以下二维码关注仰山智库
1. 触站AI的功能与特点
触站AI是一款功能强大的AI绘画场景软件,它具有以下几个主要特点:
AI绘画场景软件:让绘画更智能、创作更便捷
学费1680元到2万元不等,义乌直播带货培训生意场面面观
原标题:学费1680元到2万元不等,义乌直播带货培训生意场面面观