中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

CC

  • API
    def run[VD: ClassTag, ED: ClassTag](graph: Graph[VD, ED]): Graph[VertexId, ED]
    def run[VD: ClassTag, ED: ClassTag](graph: Graph[VD, ED], maxIterations: Int): Graph[VertexId, ED]
  • 功能描述

    根据输入的无向图信息精确计算所有的连通分量,接口与开源保持一致

  • API描述
    1. 包名:package org.apache.spark.graphx.lib
    2. 类名:ConnectedComponents
    3. 方法名:run
    4. 输入:

      graph: Graph[VD, ED]

    5. 参数详情:

      参数名称

      参数含义

      取值类型

      graph

      Graph数据

      Graph[VD,ED],VD及ED分别为点和边的属性类型

      maxIterations

      迭代次数(不影响计算结果)

      大于0的整型值

    6. 输出:Graph[VertexId, ED],相同连通分量的顶点,顶点属性会用类型为VertexId的同一个整数进行标记,即为连通分量编码,该编号取值不保证连续。
  • 使用样例

    ConnectedComponents样例:

    val sparkConf = new SparkConf().setAppName("Connected_Components").setMaster(host) val sc = new SparkContext(sparkConf)
    val input = sc.parallelize(Array((2L,6L),(2L,4L),(10L,9L),(9L,1L),(7L,1L)),2) val graph = Graph.fromEdgeTuples(input, 0) val res = ConnectedComponents.run(graph)
    res.vertices.collect().foreach(println)
  • 样例结果

节点id

连通分量id

1

1

2

2

4

2

6

2

7

1

9

1

10

1