概述
本文记录机器学习库Sklearn
在Ubuntu
上的环境搭建,并在搭建好的环境上运行example
以验证环境已经搭建成功;工作之余学习一下,大势所趋,别划了呀!跟上潮流呀!
安装Sklearn
Sklearn是一套通用机器学习开源框架,主要功能有6部分
分类
回归
聚类
降维
模型选择
数据预处理
Sklearn使用的是Python
语言,其安装和运行还依赖pip
、scipy
和numpy
等
安装python
这里就不说了,默认机器上都会装的,如果自己装的话注意设置环境变量就行了
安装pip
pip是什么,百度说是一个安装和管理python包的工具,知道这就够了
apt-get install python-pip
安装依赖
以下命令安装sklearn需要的各种依赖库
apt-get install build-essential python-dev python-numpy python-setuptools python-scipy libatlas-dev libatlas3-base
以下命令安装一个画图工具,用它看程序运行结果
apt-get install python-matplotlib
安装Sklearn
pip install -U scikit-learn
确认安装
以下命令会列出当前系统安装的所有python依赖
pip install -U scikit-learn
如果结果里有scikit-learn
,说明已经安装上了
验证环境
到sklearn官网,点击example进入General examples
页面,如图
页面上有很多机器学习的examples,就选取第一个例子,点击进入
说这是一个Cross-Validated Predictions
(交叉验证预测)的例子,下面有代码,可以下载下来,也可以自己写,我是自己照着抄了一遍,熟悉一下python语法,现学现用,前两天刚在w3c shcool上看了一下python语法大概什么样子
这个例子的源码如下,本文不进行代码分析和例子的原理研究,使用这个例子的目的只是为了验证环境搭建是否成功
from sklearn import datasetsfrom sklearn.model_selection import cross_val_predictfrom sklearn import linear_modelimport matplotlib.pyplot as pltlr = linear_model.LinearRegression()boston = datasets.load_boston()y = boston.target# cross_val_predict returns an array of the same size as `y` where each entry# is a prediction obtained by cross validation:predicted = cross_val_predict(lr, boston.data, y, cv=10)fig, ax = plt.subplots()ax.scatter(y, predicted, edgecolors=(0, 0, 0))ax.plot([y.min(), y.max()], [y.min(), y.max()], 'k--', lw=4)ax.set_xlabel('Measured')ax.set_ylabel('Predicted')plt.show()
在Ubuntu上写好代码,文件为plot_cv_predict.py,运行代码
python plot_cv_predict.py
运行结果如图
说明环境已经搭建完成
关于人工智能的学习资料来源,主要来自以下内容
斯坦福大学 吴恩达机器学习公开课 : 机器学习的动机与应用
开发者头条