图像分割是将一幅图像分割成有意义区域的过程。区域可以是图像的前景与背景或者单个对象。这些区域可以利用诸如颜色、边线或近邻相似性等特征构建。本文,将介绍一些不同的分割技术
图切是将一个有向图分割成两个互不相交的集合,可以用来解决很多计算机视觉方面的问题,诸如立体深度重建、图像拼接和图像分割。从图像像素和像素的邻近创建一个图并引入一个能量或“代价”函数,即有可能利用图割方法将图像分割成两个或多个区域。其基本**是,相似且彼此相近的像素应该划分到同一区域。
图割C(C是图中所有边的集合)的代价函数定义为所有割的边的权重求和相加。
寻找最小割(minimum cut 或min cut)等同于在源点和汇点间寻找最大流(maxmum flow或max flow)。在图割例子中,要用到"python-graph"工具包,可以在 http://code.google.com/p/python-graph 下载。
我们先来给出一个用python-graph工具包计算一副较小图的最大流/最小割的简单例子:
from pygraph.classes.digraph import digraph
from pygraph.algorithms.minmax import maximum_flow
gr = digraph()
gr.add_nodes([0,1,2,3])
gr.add_edge((0,1), wt=4)
gr.add_edge((1,2), wt=3)
gr.add_edge((2,3), wt=5)
gr.add_edge((0,2), wt=3)
gr.add_edge((1,3), wt=4)
flows,cuts = maximum_flow(gr, 0, 3)
print ('flow is:' , flows)
print ('cut is:' , cuts)
首先,创建有4个节点的有向图,4个节点的索引分别为0 1 2 3,然后用add_edge()增添边并为每条边指定特定的权重。边的权重用来衡量边的最大流容量。以节点0为源点,3为汇点,计算最大流。结果如下:
结果包含了流穿过每条边和每个节点的标记:0是包含图源点的部分,1是与汇点相连的节点。这个割是最小的。
我们先看一下帝国大厦的这张原图:
图割后的图片如下:左为利用贝叶斯概率模型进行图割分割,用于模型训练的标记图像;右为分割结果。
源码如下:
# -*- coding: utf-8 -*-
from scipy.misc import imresize
from PCV.tools import graphcut
from PIL import Image
from numpy import *
from pylab import *
im = array(Image.open("empire.jpg"))
im = imresize(im, 0.07)
size = im.shape[:2]
print ("OK!!")
# add two rectangular training regions
labels = zeros(size)
labels[3:18, 3:18] = -1
labels[-18:-3, -18:-3] = 1
print ("OK!!")
# create graph
g = graphcut.build_bayes_graph(im, labels, kappa=1)
# cut the graph
res = graphcut.cut_graph(g, size)
print ("OK!!")
figure()
graphcut.show_labeling(im, labels)
figure()
imshow(res)
gray()
axis('off')
show()