为了学习Alink以及所涉及的Flink知识,本仓库有两大目的
首先,旨在使用scala实现Alink文档中提到的所有特性,包括但不仅限于以下:
- 分类算法
- 随机森林分类
- 支持向量机
- 决策树
- 朴素贝叶斯方法
- 多层感知机
- gbdt二分类
- softmax多分类
- 逻辑回归
- OneVsRest
- 回归算法
- gbdt回归
- 线性回归
- 随机森林回归
- 保序回归
- 广义线性回归
- AFT生存回归
- 决策树回归
- Lasso回归
- 岭回归
- 聚类算法
- 二分K均值聚类
- KMeans
- 高斯混合模型
- LDA
- 协同过滤
- ALS
- 异常检测
- SOS
- 关联规则
- FP-Growth
- PrefixSpan
- 在线学习
- ftrl
- 特征工程
- 模型的选择和调参
- 模型的保存和加载
其次,本项目也包含了必要的Pom, Jar, 数据集以及官方示例。
- Pom
- pom.xml
- Jar
- alink_core-0.1-SNAPSHOT.jar
- 官方数据集
- adult_train & adult_test
- iris
- movielens_rating
- review_rating_train
- avazu-small
- 自定义数据集
- Mall_Costumers
- 50_startups
- lda-test-demo
- FpGrowth-test-demo
- PrefixSpan-test-demo
- 官方jupyter notebook示例
- adult.ipynb
- ftrl_demo.ipynb
- adult.ipynb
- ftrl_demo.ipynb
- kmeans.ipynb
- mnist.ipynb
- review_naive_bayes.ipynb
- 官方Java示例
- ALSExample.java
- GBDTExample.java
- KMeansExample.java
持续更新。。。。