知识体系
机器学习怎么学?
先正名,善造势,重时间,涨视野。尽快建立知识的主干与知识的体系。
今日主题
重点不在理论和实践,而在思想和概念,以体系为主。
python的优势
热门、好学、开源、资源丰富、随处可用。
Scikit-Learn
简介
资料
python机器学习的入门
什么是机器学习?
机器学习是从数据中自动提取知识,通常是对新的看不见的数据做出预测,一个典型的例子是垃圾邮件过滤器。通过用户不断地将收到的邮件标记为垃圾邮件或者非垃圾邮件,然后利用机器学习算法求得可以自动区分垃圾邮件和普通邮件的”预测模型”,该模型可以预测新邮件是否为垃圾邮件。
机器学习的核心概念:无需用户指定明确的决策规则而从数据中 自动做出决策(decision making).
另外一个重要的核心概念我们称之为:泛化。机器学习的目的是给之前尚未见过测试过的数据做出预测。例如我们对于已经标记好的垃圾邮件不感兴趣,重要的是新邮件到来时,上述软件是否能够帮我们自动的过滤垃圾邮件。
鸢尾花Iris机器学习分类实例
我们将每个花朵样本表示为数组中的一行,而列的特征则表示为花朵的储存,例如使用以下矩阵格式表示这个鸢尾花的数据集,由150个样本和4个特征构成一个二维阵列或者称为矩阵$R^{150*4}$,如下
python科学计算
numpy1
2
import numpy as npy
matploit
数据的表示与可视化
机器学习是模型对数据的拟合,优秀的数据表示与可视化能够
scikit-learn中的数据
[n_samples, n_features]
n_samples:样本数
n_features:特征数