Python 机器学习 10 大经典算法的讲解和示例

acoputojos · 发表于前天 07:24

在机器学习领域，有许多经典且强大的算法。本文将为您详细讲解 Python 中 10 大经典机器学习算法，并提供相应的示例代码。
一、线性回归（Linear Regression）
线性回归是用于预测连续数值的监督学习算法。它试图找到输入特征与目标变量之间的线性关系。
收起
python
复制
from sklearn.linear_model import LinearRegression
import numpy as np
X = np.array([[1], [2], [3], [4], [5]])
y = np.array([1, 3, 2, 3, 5])
model = LinearRegression()
model.fit(X, y)
print("预测值:", model.predict([[6]]))
二、逻辑回归（Logistic Regression）
逻辑回归用于二分类问题，通过计算概率来确定样本属于某一类别的可能性。
收起
python
复制
from sklearn.linear_model import LogisticRegression
X = np.array([[1, 2], [2, 3], [3, 4], [4, 5]])
y = np.array([0, 0, 1, 1])
model = LogisticRegression()
model.fit(X, y)
print("预测类别:", model.predict([[5, 6]]))
三、决策树（Decision Tree）
决策树通过对数据进行一系列的条件判断来进行分类或回归。
收起
python
原文链接：http://www.xamlct.cn
from sklearn.tree import DecisionTreeClassifier
X = np.array([[1, 2], [2, 3], [3, 4], [4, 5]])
y = np.array([0, 0, 1, 1])
model = DecisionTreeClassifier()
model.fit(X, y)
print("预测类别:", model.predict([[5, 6]]))
四、随机森林（Random Forest）
随机森林是由多个决策树组成的集成学习算法，能有效避免过拟合。
收起
python
复制
from sklearn.ensemble import RandomForestClassifier
X = np.array([[1, 2], [2, 3], [3, 4], [4, 5]])
y = np.array([0, 0, 1, 1])
model = RandomForestClassifier()
model.fit(X, y)
print("预测类别:", model.predict([[5, 6]]))
五、支持向量机（Support Vector Machine，SVM）
SVM 旨在找到一个超平面，将不同类别的数据点尽可能分开。
收起
python
原文链接：http://www.hyydbzj.com.cn
from sklearn.svm import SVC
X = np.array([[1, 2], [2, 3], [3, 4], [4, 5]])
y = np.array([0, 0, 1, 1])
model = SVC()
model.fit(X, y)
print("预测类别:", model.predict([[5, 6]]))
六、K 近邻（K-Nearest Neighbors，KNN）
KNN 根据样本点周围的 K 个近邻的类别来进行分类。
收起
python
复制
from sklearn.neighbors import KNeighborsClassifier
X = np.array([[1, 2], [2, 3], [3, 4], [4, 5]])
y = np.array([0, 0, 1, 1])
model = KNeighborsClassifier(n_neighbors=2)
model.fit(X, y)
print("预测类别:", model.predict([[5, 6]]))
七、朴素贝叶斯（Naive Bayes）
基于贝叶斯定理，假设特征之间相互独立，用于分类问题。
原文链接：http://www.lai0791.cn
python
复制
from sklearn.naive_bayes import GaussianNB
X = np.array([[1, 2], [2, 3], [3, 4], [4, 5]])
y = np.array([0, 0, 1, 1])
model = GaussianNB()
model.fit(X, y)
print("预测类别:", model.predict([[5, 6]]))
八、K-Means 聚类
K-Means 用于将数据分为 K 个聚类。
收起
python
复制
from sklearn.cluster import KMeans
X = np.array([[1, 2], [2, 3], [3, 4], [4, 5], [5, 6]])
model = KMeans(n_clusters=2)
model.fit(X)
print("聚类标签:", model.labels_)
九、主成分分析（Principal Component Analysis，PCA）
PCA 用于数据降维，提取主要成分。
收起
python
复制
from sklearn.decomposition import PCA
X = np.array([[1, 2], [2, 3], [3, 4], [4, 5], [5, 6]])
pca = PCA(n_components=1)
X_pca = pca.fit_transform(X)
print("降维后的数据:", X_pca)
十、梯度提升树（Gradient Boosting Decision Tree，GBDT）
GBDT 是一种强大的集成学习算法，通过不断拟合残差来提高性能。
收起
python
复制
from sklearn.ensemble import GradientBoostingClassifier
X = np.array([[1, 2], [2, 3], [3, 4], [4, 5]])
y = np.array([0, 0, 1, 1])
model = GradientBoostingClassifier()
model.fit(X, y)
print("预测类别:", model.predict([[5, 6]]))
以上只是对这些算法的简单介绍和基础示例，在实际应用中，还需要根据数据特点和问题需求进行适当的调整和优化。
希望本文能帮助您初步了解 Python 中这 10 大经典机器学习算法。

来源：
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！