介绍
Apache Spark是用于大规模数据处理的统一分析引擎,具有可伸缩、基于内存计算等特点,已经成为轻量级大数据快速处理的统一平台,各种不同的应用,如实时流处理、机器学习、交互式查询等,都可以通过Spark建立在不同的存储和运行系统上。更多关于Spark信息请参见官网Spark官方文档。
鲲鹏BoostKit
图分析算法根据实际使用场景一般分为中心性分析算法、拓扑度量算法、路径分析算法、社团挖掘算法、图表示学习算法、相似性分析算法六大类。本文旨在介绍图算法开发过程中的流程。
父主题: 开发指南