该软件共集成了6种采样算法,包括随机点采样(Random Node),随机边采样(Random Edge),广度优先算法(Breadth First Search),随机游走采样(Random Walk),Metropolis-Hasting 随机游走采样(MH Random Walk),双网络图采样(Bi-graph Random Walk)。


随机点采样(Random Node, RN)

        在已知整个网络中节点的情况下,RN随机选取整个网络中的部分节点作为样本,每个节点被采样到的概率为1/N,N为网络中节点的数量。

随机边采样(Random Edge, RE)

        在已知整个网络中节点和边的情况下,RE随机选取网络中的边,对于选到的边等概率地选择其所连的节点或把两个节点全都加入样本集。

广度优先算法(Breadth First Search, BFS)

        BFS无需提前知晓整个网络中的节点和边的情况,采样过程从一个初始节点出发,在每一步的采样中,之前最早被发现但还未被采样的节点被选为下一个要采样的节点。

随机游走采样(Random Walk, RW)

        在RW的每一步采样中,从当前节点v的邻居节点中随机地选取一个节点w作为下一个待采样节点。从节点v随机游走到其邻居节点w 的概率为:

Metropolis-Hasting 随机游走采样(Metropolis-Hasting Random Walk, MHRW)

        MHRW针对经典随机游走算法对于度大节点的偏向性问题进行了修正和改进。在MHRW中,从当前节点v随机游走到其邻居节点w的概率被修正为::

双网络图采样(Bi-graph Random Walk, BRW)

        BRW在针对有向网络的每一步的采样中,基于当前节点和其邻居节点的连接关系,将当前节点和其邻居节点及两者之间的连边组成的网络分割为入度网络和出度网络,并使用两步走的采样策略进行采样:首先基于当前节点的出度和入度随机选择一个网络,再在该网络上随机选择下一个待采样节点。