Java实现分类算法入门指南（手把手教你用Java编写基础分类算法）

主机测评网
Java
2025-12-15
453

在人工智能和大数据时代，分类算法是机器学习中最基础、最常用的技术之一。无论你是编程新手还是有一定经验的开发者，掌握如何用Java语言实现简单的分类算法，都是迈向数据科学的重要一步。本教程将带你从零开始，使用纯Java代码实现一个经典的K近邻（K-Nearest Neighbors, KNN）分类算法，适合初学者Java教程学习。

Java实现分类算法入门指南（手把手教你用Java编写基础分类算法） Java分类算法机器学习Java实现 Java数据分类初学者Java教程第1张

什么是分类算法？

分类算法是一种监督学习方法，其目标是根据已知标签的训练数据，对新的未知数据进行类别预测。例如：根据邮件内容判断是否为垃圾邮件，或根据用户行为判断是否会购买某商品。

为什么选择KNN算法？

K近邻（KNN）算法简单直观，不需要复杂的数学推导，非常适合初学者理解分类的基本思想。它的核心理念是：“物以类聚”——一个样本的类别由其最近的K个邻居的多数类别决定。

Java实现KNN分类算法

下面我们用纯Java代码实现一个简化版的KNN分类器。我们将使用欧几里得距离来计算样本之间的相似度。

1. 定义数据点类

public class DataPoint {    private double[] features; // 特征向量，如 [身高, 体重]    private String label;      // 类别标签，如 "男性" 或 "女性"    public DataPoint(double[] features, String label) {        this.features = features.clone();        this.label = label;    }    public double[] getFeatures() {        return features.clone();    }    public String getLabel() {        return label;    }}

2. 实现KNN分类器

import java.util.*;public class KNNClassifier {    private List<DataPoint> trainingData;    private int k;    public KNNClassifier(int k) {        this.k = k;        this.trainingData = new ArrayList<>();    }    // 添加训练数据    public void addTrainingData(DataPoint point) {        trainingData.add(point);    }    // 计算欧几里得距离    private double euclideanDistance(double[] a, double[] b) {        double sum = 0.0;        for (int i = 0; i < a.length; i++) {            sum += Math.pow(a[i] - b[i], 2);        }        return Math.sqrt(sum);    }    // 预测新样本的类别    public String predict(double[] testFeatures) {        // 存储 (距离, 标签)        List<Map.Entry<Double, String>> distances = new ArrayList<>();        for (DataPoint point : trainingData) {            double dist = euclideanDistance(testFeatures, point.getFeatures());            distances.add(new AbstractMap.SimpleEntry<>(dist, point.getLabel()));        }        // 按距离升序排序        distances.sort(Map.Entry.comparingByKey());        // 统计前k个邻居的类别        Map<String, Integer> voteCount = new HashMap<>();        for (int i = 0; i < k && i < distances.size(); i++) {            String label = distances.get(i).getValue();            voteCount.put(label, voteCount.getOrDefault(label, 0) + 1);        }        // 返回得票最多的类别        return Collections.max(voteCount.entrySet(),                Map.Entry.comparingByValue()).getKey();    }}

3. 使用示例

public class Main {    public static void main(String[] args) {        // 创建KNN分类器，k=3        KNNClassifier knn = new KNNClassifier(3);        // 添加训练数据（[身高(cm), 体重(kg)], 性别）        knn.addTrainingData(new DataPoint(new double[]{180, 75}, "男性"));        knn.addTrainingData(new DataPoint(new double[]{165, 50}, "女性"));        knn.addTrainingData(new DataPoint(new double[]{175, 70}, "男性"));        knn.addTrainingData(new DataPoint(new double[]{160, 48}, "女性"));        // 预测新样本 [170, 60]        String prediction = knn.predict(new double[]{170, 60});        System.out.println("预测结果: " + prediction); // 可能输出 "女性" 或 "男性"    }}