我要评分

文档获取效率

文档正确性

内容完整性

文档易理解

在线提单

论坛求助

更新说明

大数据算法加速库兼容Spark原生API，对机器学习和图分析算法进行了性能优化，大幅提升了大数据算法场景的计算性能，该库支持鲲鹏处理器的体系架构，1.2.0版本提供的算法有：

机器学习算法
- GBDT（Gradient Boosting Decision Tree，梯度提升决策树）
- RF（Random Forest，随机森林）
- SVM（Support Vector Machines，支持向量机）
- Kmeans（K-means Clustering，K-平均算法）
- DecisionTree（决策树算法）
- LinearRegression（线性回归）
- Logistic Regression（逻辑回归）
- PCA（Principle Component Analysis，主成分分析）
- SVD（Singular Value Decomposition，奇异值分解）
- LDA（Latent Dirichlet Allocation，潜在狄利克雷分布）
- ALS（Alternating Least Squares，交替最小二乘法）
- PrefixSpan（Prefix-Projected Pattern Growth，前缀投影的模式挖掘）
- KNN（K-Nearest Neighbors，K最近邻算法）

图分析算法
- MCE（Maximal Clique Enumeration，极大团）
- WCE（Weak Clique Enumeration，弱团）
- Modularity（模块度）
- TC（Triangle Count，三角形计数）
- MSSP（Multiple Sources Shortest Path，多源最短路径）
- PageRank（网页排名）
- SCC（Strongly Connected Components，强联通分量）
- Louvain（基于模块度的社区发现算法）
- LPA（Label Propagation Algorithm，标签传播）
- Closeness（紧密中心性）
- CD（Cycle Detection，环路检测）
- CC（Connected Components，连通分量）
- KCore（K-Core Decomposition）
- Degree（Degree Centrality，度中心性）
- BFS（Breadth-First-Search，广度优先搜索）

父主题： V1.2.0