100DaysOfMLCode
100DaysOfMLCode
2018-08-06-Day01
- 安装依赖包 python -m pip install [name]
- 按up button直接复制上一行
- 按right button原位复制填充
- 按shift+方向键 选择
- 读取csv文件 pandas.read_csv('name.csv')
- 为数据帧的变量构建矩阵和向量dataset.iloc[].values
- 缺失数据补齐sklearn.preprocessing imputer.transform
- 标签sklearn.preprocessing labelencoder
- 创建虚拟变量onehotencoder
- 分训练测试集sklearn.crossvalidation train_test_split()
- 特征标准化 sklearn.preprocessing StandardScalar
2018-08-07-Day02
- train_test_split
- test_size 样本占比(样本数), random_state 随机数种子
- matplotlib.pyplot 强大画图库-visualization
- plt.scatter 散点
- plt.plot 连续图像
- plt.show() 画图!
2018-08-08-Day03
-
与simple linear regression对比:
-
dataset.iloc中: x 1 -1 y 1 4
-
加入dummy var (bool型) //using onehotencoder
-
qusetions: 1.单一因变量? 2.plt函数奇葩图像
2018-08-09-Day04
- 强烈需要学习matplotlib库!!!!!唔
2018-08-10-Day05
- numpy.ndarray n维数组
- plt.plot(X_, **, 'ro', **)中'ro'相当于scatter
- confusion_matrix
2018-08-11-Day06
- ndarray类比C语言多维数组
- 面对ndarray的plot or scatter 可采取for遍历……可惜比较复杂
- 搜寻简单方法
2018-08-12-Day07
- K nearest neighbors 简称KNN
- 库: from sklearn.neighbors import KNeighborsClassifier
- KNN针对该Social_Network_Ads.csv数据比LR更准确
2018-08-13-Day08
- bug:sns.pairplot(df, hue='class', size=2.5)
- seaborn也是画图软件?
- 交互式编程与编译器的差异
- binary参数可用LR 多类数据必须用softmat回归
2018-08-14-Day09
- 超平面!
2018-08-15-Day10
- 发现matplotlib实现方案
- enumerate np.meshgrid ravel np.unique np.arrange
- []中真值表达式等价一句话if
2018-08-16-Day11
- 搭建vultr服务器……
2018-08-17-Day12
- 先验概率P(c) 后验概率P(c|x)
- 朴素贝叶斯分类器(Naive Bayes Classification)
- 拉普拉斯修正(Laplacian correction)
2018-08-18-Day13
- 发现Youtube新course ML for Hackers
- 快两周了 着手完成 ML in 3 Months 的Month1部分
2018-08-19-Day14
- 复习微积分