更新说明
大数据算法加速库兼容Spark原生API,对机器学习和图分析算法进行了性能优化,大幅提升了大数据算法场景的计算性能,该库支持鲲鹏处理器的体系架构,1.2.0版本提供的算法有:
- 机器学习算法
- GBDT(Gradient Boosting Decision Tree,梯度提升决策树)
- RF(Random Forest,随机森林)
- SVM(Support Vector Machines,支持向量机)
- Kmeans(K-means Clustering,K-平均算法)
- DecisionTree(决策树算法)
- LinearRegression(线性回归)
- Logistic Regression(逻辑回归)
- PCA(Principle Component Analysis,主成分分析)
- SVD(Singular Value Decomposition,奇异值分解)
- LDA(Latent Dirichlet Allocation,潜在狄利克雷分布)
- ALS(Alternating Least Squares,交替最小二乘法)
- PrefixSpan(Prefix-Projected Pattern Growth,前缀投影的模式挖掘)
- KNN(K-Nearest Neighbors,K最近邻算法)
- 图分析算法
- MCE(Maximal Clique Enumeration,极大团)
- WCE(Weak Clique Enumeration,弱团)
- Modularity(模块度)
- TC(Triangle Count,三角形计数)
- MSSP(Multiple Sources Shortest Path,多源最短路径)
- PageRank(网页排名)
- SCC(Strongly Connected Components,强联通分量)
- Louvain(基于模块度的社区发现算法)
- LPA(Label Propagation Algorithm,标签传播)
- Closeness(紧密中心性)
- CD(Cycle Detection,环路检测)
- CC(Connected Components,连通分量)
- KCore(K-Core Decomposition)
- Degree(Degree Centrality,度中心性)
- BFS(Breadth-First-Search,广度优先搜索)
父主题: V1.2.0