中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

算法原理

  • MCE算法

    MCE(Maximal Clique Enumeration,极大团)算法是在大规模图数据中,精确求解所有的极大团,其中极大团的定义如下:团是图中一个两两之间有边的顶点集合。如果一个团不被其他任何一个团包含,那么这个团即为极大团。

  • WCE算法

    WCE(Weak Clique Enumeration,弱团)是一种重叠社区发现的算法,在社交网络中是一个很重要的研究。所谓的弱团挖掘,即利用检测到的三角形结果,如果两个三角形有一条边是重叠的,则将两个三角形合并在一起,并递归的合并下去, 终到不能合并为止。

  • Modularity算法

    Modularity,模块度算法针对带有社区划分信息的图而言,该社区划分不存在重叠,可支持有向/无向图。模块度计算的目的是衡量对应社区划分在指定图上的质量,本质是衡量图中的边在社区内的分布与在整个图中分布的差异,越多比例的边分布在社区内部,对应社区划分在图上的模块度值就越大,社区划分的质量也就越高。模块度的计算基于图中节点的社区信息对边进行聚合,然后针对不同社区统计边的分布信息,最后得出模块度的值。

  • TC算法

    TC(Triangle Count,三角形计数)算法在大规模图数据计算领域,是社交网络分析的基本算法,可以计算出图网络中每个节点与其余节点形成的三角形个数,支撑数千万及上亿节点、十亿边数的无向网络图的三角形计数。

  • MSSP算法

    MSSP(Multiple Sources Shortest Path,多源最短路径)算法,是最短路径领域的基础算法,是指给定图数据集和指定部分节点,计算图中所有节点到给定节点的最短路径距离。

  • PageRank算法

    PageRank,网页排名算法是Google公司所使用的对其搜索引擎搜索结果中的网页进行排名的一种算法,也是图计算及推荐领域的基础算法。PageRank本质上是一种以网页之间的超链接个数和质量作为主要因素粗略地分析网页的重要性的算法。 其基本假设是:更重要的页面往往更多地被其他页面引用(或称其他页面中会更多地加入通向该页面的超链接)。

  • SCC算法

    SCC(Strongly Connected Components,强联通分量)算法是图计算领域的基础算法。在有向图中,强连通图是指每一个顶点皆可以经由该图上的边抵达其他的每一个点的有向图,即对于图上的每一个点对(Va, Vb ),都有Va→Vb以及Vb→Va。强连通分量则是指有向图的极大强连通子图。

  • Louvain算法

    Louvain算法作为一种以最大化模块度(Modularity)数值为目标函数的一种社区检测方法,具有社区检测效果好、速度快等特点。其主要通过贪心算法的策略,从底层不断聚合节点,每一次节点的聚合都选择能够使当前模块度增益最大的操作,从而最终达到社区划分结果在模块度评价指标上的最优解。

  • LPA算法

    LPA(Label Propagation,标签传播)算法是图分析领域的经典算法,主要利用邻居的标签信息在网络图中传播而进行非重叠社团划分。

  • Closeness算法

    Closeness,紧密中心性算法计算图中紧密中心性值最大的K个结点,支持有向图(含有/无权图,有权图要求输入边权值大于0)。紧密中心性计算的目的是衡量图中每个结点的与其它结点之间的接近程度,结点与其它结点的平均距离越短,则结点的紧密中心性值越大,结点在图中的重要性也就越高。紧密中心性的计算基于图中每个结点到其它所有结点的平均距离计算,然后得出每个结点的紧密中心性的值,最后选取图中紧密中心性值最大的K个结点,输出这K个结点的编号和紧密中心性值。

  • CD算法

    CD(Cycle Detection,环路检测)算法是图分析领域的基础算法,通常是在有向图中枚举出满足需求的所有环路。而在现实网络中,无约束的环很多,同时很大一部分环路信息是无用的,所以在本算法中,通过指定的约束条件,如环路长度约束、环路中边权重的约束,求解对应的环路信息。

  • CC算法

    CC(Connected Components,连通分量)算法是图计算领域的基础算法,用于求解无向图的所有连通分量。其中连通分量的定义如下:连通分量是指无向图中的极大连通子图,即子图中的任意点都可以通过边互相抵达,且与子图外的任意点不能互相抵达。本算法基于Spark计算引擎,精确求解所有连通分量。

  • KCore算法

    KCore(K-Core Decomposition,k核算法)对用户输入的图数据,精确求解图中各个节点coreness值。其中coreness值的定义如下:一个顶点属于k-core subgraph,但不属于(k+1)-core subgraph,则这个顶点的core number = k。k-core subgraph的定义如下:图G中的极大子图Gk,Gk中的所有顶点的度deg(v) ≥ k。

  • Degree算法

    Degree(Degree Centrality,度中心性)算法用于计算图中每个节点的度中心性值,支持无向图和有向图。度中心性是衡量节点重要性的重要指标,节点与其它节点的边越多,则节点的度中心性值越大,节点在图中的重要性也就越高。在无向图中,度中心性的计算是基于边信息统计节点出现次数,得出节点的度中心性的值,在有向图中则基于边的方向进行筛选,基于输入边或输出边信息统计节点出现次数,得到节点的入度值或出度值。

  • BFS算法

    BFS(Breadth-First-Search,广度优先搜索)算法,是图分析领域的基础算法,通过广度优先的方式对图进行搜索遍历直到达到最大搜索深度或访问完所有可达节点。