认识
一、认识
机器学习(Machine Learning
, ML
) 是人工智能(AI
)的一个分支,核心思想是让计算机能够从数据中学习,然后在没有明确编程指令的情况下做出决策或预测。简单来说,机器学习是用算法来自动分析数据,找到模式,并基于这些模式进行推理。也可以说: 机器学习是对能通过经验自动改进的计算机算法的研究。例如:
-
图片识别(如人脸识别、手写文字识别)
-
语音识别(如Siri、智能语音助手)
-
推荐系统(如抖音、YouTube、Netflix 的个性化推荐)
-
自动驾驶(识别交通信号、行人等)
1.1 类型
机器学习 的基本类型
-
监督学习(
Supervised Learning
): 有标注数据的学习方式,即训练数据由 输入(X)和输出(Y) 组成,模型通过学习输入和输出之间的关系来进行预测。比如: 图片分类(输入是图片,输出是类别); 房价预测(输入是房屋信息,输出是房价)。常见的算法有: 线性回归(Linear Regression
)、逻辑回归(Logistic Regression
)、决策树(Decision Tree
)、随机森林(Random Forest
)、支持向量机(SVM
)、深度学习(神经网络) -
无监督学习(
Unsupervised Learning
): 没有标注数据,模型通过分析数据的内在结构来发现隐藏模式。比如: 聚类(Clustering
):如市场中的用户群体分析(K-means
、DBSCAN
)、降维(Dimensionality Reduction
):如数据可视化(PCA
、t-SNE
) -
强化学习(
Reinforcement Learning
,RL
): 基于奖励和惩罚机制,模型在不断尝试中学习最优策略。比如:AlphaGo
围棋AI
、游戏AI
(Deep Q-Learning
)、机器人控制
1.2 流程
机器学习的核心流程
-
收集数据(数据集)
-
数据预处理(清理、归一化、特征工程)
-
选择模型(如决策树、神经网络等)
-
训练模型(使用训练数据进行学习)
-
评估模型(测试数据验证模型效果)
-
优化模型(调整参数、改进算法)
-
部署应用(在实际业务中应用模型)