首页 > 技术,让世界更美好。 > 【spark】【machine learning】机器学习算法效果评估方法————回归模型的评估

【spark】【machine learning】机器学习算法效果评估方法————回归模型的评估

2017年1月17日

当从多个自变量预测连续输出变量时,使用回归分析。

可用指标:

回归模型1

(MSE:均方误差;RMSE:均方根误差;MAE:平均绝对误差)

代码实例:

import org.apache.spark.mllib.regression.LinearRegressionWithSGD
import org.apache.spark.mllib.evaluation.RegressionMetrics
import org.apache.spark.mllib.util.MLUtils

// Load the data
val data = MLUtils.loadLibSVMFile(sc, "data/mllib/sample_linear_regression_data.txt").cache()

// Build the model
val numIterations = 100
val model = LinearRegressionWithSGD.train(data, numIterations)

// Get predictions
val valuesAndPreds = data.map{ point =>
  val prediction = model.predict(point.features)
  (prediction, point.label)
}

// Instantiate metrics object
val metrics = new RegressionMetrics(valuesAndPreds)

// Squared error
println(s"MSE = ${metrics.meanSquaredError}")
println(s"RMSE = ${metrics.rootMeanSquaredError}")

// R-squared
println(s"R-squared = ${metrics.r2}")

// Mean absolute error
println(s"MAE = ${metrics.meanAbsoluteError}")

// Explained variance
println(s"Explained variance = ${metrics.explainedVariance}")

 

本文的评论功能被关闭了.