OpenCV 笔记(2)：图像的属性以及像素相关的操作 - 服务器托管|北京服务器租用|机房托管租用|IDC托管租用|机房机柜带宽租用-价格及费用咨询

Part11. 图像的属性

11.1 Mat 的主要属性

在前文中，我们大致了解了 Mat 的基本结构以及它的创建与赋值。接下来我们通过一个例子，来看看 Mat 所包含的常用属性。

先创建一个 3*4 的四通道的矩阵，并打印出其相关的属性，稍后会详细解释每个属性的含义。

MatsrcImage(3,4,CV_16UC4,Scalar_(1,2,3,4));

cout

输出结果：

[1,2,3,4,1,2,3,4,1,2,3,4,1,2,3,4;
1,2,3,4,1,2,3,4,1,2,3,4,1,2,3,4;
1,2,3,4,1,2,3,4,1,2,3,4,1,2,3,4]
dims:2
rows:3
cols:4
channels:4
type:26
depth:2
elemSize:8
elemSize1:2
step:32
step[0]:32
step[1]:8
step1[0]:16
step1[1]:4

在上述例子中我们打印了 Mat 的很多属性，它们主要包括：

rows：表示图像的高度。
cols：表示图像的宽度。
dims：表示矩阵的维度。
data：表示 Mat 对象中的指针（uchar 类型的指针），指向内存中存放矩阵数据的一块内存（uchar* data）。
channels：表示通道数量；例如常见的 RGB、HSV 彩色图像，则 channels=3；若为灰度图，则 channels=1。
depth：表示图像的深度，它用来度量每一个像素中每一个通道的精度，它本身与通道数无关，它的数值越大表示精度越高。

数据类型	depth 的值	数据类型	取值范围	对应 C++ 的类型
CV_8U	0	8 位无符号类型	0—255	uchar, unsigned char
CV_8S	1	8 位有符号类型	-128—127	char
CV_16U	2	16 位无符号类型	0—65535	ushort, unsigned short, unsigned short int
CV_16S	3	16 位有符号类型	-32768—32767	short, short int
CV_32S	4	32 位整数数据类型	-2147483648—2147483647	int, long
CV_32F	5	32 位浮点数类型	(1.18e-38……3.40e38)	float
CV_64F	6	32 位双精度类型	(2.23e-308……1.79e308)	double

type：表示矩阵的数据类型，它包含矩阵中元素的类型以及通道数信息。

数据类型	1	2	3	4
CV_8U	CV_8UC1	CV_8UC2	CV_8UC3	CV_8UC4
CV_8S	CV_8SC1	CV_8SC2	CV_8SC3	CV_8SC4
CV_16U	CV_16UC1	CV_16UC2	CV_16UC3	CV_16UC4
CV_16S	CV_16SC1	CV_16SC2	CV_16SC3	CV_16SC4
CV_32S	CV_32SC1	CV_32SC2	CV_32SC3	CV_32SC4
CV_32F	CV_32FC1	CV_32FC2	CV_32FC3	CV_32FC4
CV_64F	CV_64FC1	CV_64FC2	CV_64FC3	CV_64FC4

elemSize：表示矩阵中每一个元素的数据大小，它与通道数相关，单位是字节。举几个例子：如果 Mat 中的数据类型是 CV_8UC1 或 CV_8SC1，那么 elemSize=1(1 * 8 / 8 = 1 bytes); 如果 Mat 中的数据类型是 CV_8UC3 或 CV_8SC3，那么 elemSize=3(3 * 8 / 8 = 3 bytes); 如果 Mat 中的数据类型是 CV_16UC3 或 CV_16SC3，那么 elemSize=6(3 * 16 / 8 = 6 bytes); 如果 Mat 中的数据类型是 CV_32SC3 或 CV_32FC3，那么 elemSize=12(3 * 32 / 8 = 12 bytes);
elemSize1：表示矩阵中每一个元素单个通道的数据大小，单位是字节。满足：

step：字面意思是“步长”，实际上它描述了矩阵的形状。 step[] 为一个数组，矩阵有几维，step[] 数组就有几个元素。以一个三维矩阵为例，step[0] 表示一个平面的字节总数，step[1] 表示一行元素的字节总数，step[2] 表示每一个元素的字节总数。

在 OpenCV 的官方文档中，关于解释 step 时曾提到矩阵数据元素

的地址：

对于我们常用的二维数组，上述公式可化简为：

这里的 step[0] 表示一行元素的字节总数，step[1] 表示每一个元素的字节总数。

mat.png

step1： step1 也是一个数组。step1 不再以字节为单位，而是以 elemSize1 为单位，满足：

Part22. 图像的像素操作

22.1 像素的类型

我们最常用的图像是二维数组，灰度图像(CV_8UC1)会存放 C++ 的 uchar 类型，RGB 彩色图像一般会存放 Vec3b 类型。

其中，单通道数据存放格式：

三通道数据存放格式：

对于彩色图像而言，在 OpenCV 中通道的顺序是 B、G、R，这跟我们通常所说的 RGB 三原色正好相反。

当然，灰度图像也不一定都是 CV_8UC1 类型，也可能是 CV_16SC1、CV_32FC1 等，它们会存放 C++ 的 short、float 等基本类型。类似地，彩色图像也可能是 CV_16SC3、CV_32FC3 等，那它们是怎么存放的呢？

OpenCV 定义了一系列的 Vec 类，它是一个一维的向量，代表像素的类型。

typedefVecVec2b;
typedefVecVec3b;
typedefVecVec4b;

typedefVecVec2s;
typedefVecVec3s;
typedefVe服务器托管网cVec4s;

typedefVecVec2w;
typedefVecVec3w;
typedefVecVec4w;

typedefVecVec2i;
typedefVecVec3i;
typedefVecVec4i;
typedefVecVec6i;
typedefVecVec8i;

typedefVecVec2f;
typedefVecVec3f;
typedefVecVec4服务器托管网f;
typedefVecVec6f;

typedefVecVec2d;
typedefVecVec3d;
typedefVecVec4d;
typedefVecVec6d;

其中 b、s、w、i、f、d 分别表示如下的含义：

	数据类型
b	unsigned char
s	short int
w	unsigned short
i	int
f	float
d	double

Vec 类又被称为固定向量类，在编译时就知道向量的大小。类似 Vec 这样的类还有：Matx、Point、Size、Rect

我们用一张表，总结一下矩阵中的数据类型和像素的类型的对应关系：

数据类型	C1	C2	C3	C4	C6
CV_8U	uchar	Vec2b	Vec3b	Vec4b
CV_8S	char	Vec	Vec	Vec
CV_16U	ushort	Vec2w	Vec3w	Vec4w
CV_16S	short	Vec2s	Vec3s	Vec4s
CV_32S	int	Vec2i	Vec3i	Vec4i
CV_32F	float	Vec2f	Vec3f	Vec4f	Vec6f
CV_64F	double	Vec2d	Vec3d	Vec4d	Vec6d

基于上述表格我们可以回答刚才的问题，CV_16SC3 类型的图像存放的是 Vec3s 类型，CV_32FC3 类型的图像存放的是 Vec3f 类型。

32.2 像素点的读取

Mat 的 at() 函数实现了对矩阵中的某个像素的读写操作。

下面的代码展示了 at() 函数对灰度图像像素的读写：

Scalarvalue=grayImage.at(y,x);
Scalar.at(y,x)=128;

三通道彩色的图像的读取：

Vec3bvalue=image.at(y,x);

ucharblue=value.val[0];
uchargreen=value.val[1];
ucharred=value.val[2];

三通道彩色图像的赋值：

image.at(y,x)[0]=128;
image.at(y,x)[1]=128;
image.at(y,x)[2]=128;

下面的例子结合像素的类型，展示了将加载的图像转换成灰度图像，以及对灰度图像进行取反的操作。

MatsrcImage=imread("/Users/tony/beautiful.jpg");
if(srcImage.empty())
{
cout(row,col);
grayImage.at(row,col)=255-gray;
}
}

imshow("invert",grayImage);

像素点操作.png

简单提一下，上述例子中 cvtColor() 函数的作用是将图像从一个颜色空间转换到另一个颜色空间。例如，可以将图像从 BGR 色彩空间转换成灰度色彩空间，或者从 BGR 色彩空间转换成 HSV 色彩空间等等。

42.3 图像的遍历

2.3.1 基于数组遍历

前面 2.2 介绍过 at() 函数可以对某个像素进行读写操作，并用例子展示了对单通道进行遍历。

对于三通道的彩色图像可以这样遍历。

for(inti=0;i(i,j)[0]=...//B通道
srcImage.at(i,j)[1]=...//G通道
srcImage.at(i,j)[2]=...//R通道
}
}

2.3.2 基于指针遍历

Mat 类提供了更高效的 ptr() 函数，它可以得到图像任意行首地址。

下面的代码，它返回第 i+1 行的首地址，也就是指向第 i+1 行第一个元素的指针。

uchar*data=srcImage.ptr(i);

at() 函数跟 ptr() 函数在使用上有一定的区别：

at(i，j)

ptr(i)

当然，使用 ptr() 函数访问某个像素也是可以的，采用如下的方式：

mat.ptr(row)[col]

它返回的是中的模板类型指针，指向的是第 row+1 行 col+1 列的元素。

对于单通道图像的遍历：

for(inti=0;i(i);
for(intj=0;j

对于三通道图像的遍历：

for(inti=0;i(i);
for(intj=0;j

2.3.3 基于迭代器遍历

C++ STL 对每个集合类都定义了对应的迭代器类，OpenCV 也提供了 cv::Mat 的迭代器类，并且与 C++ STL 中的标准迭代器兼容。

对于单通道图像的遍历：

Mat_::iteratorbegin=srcImage.begin();
Mat_::iteratorend=srcImage.end();

for(autoit=begin;it!=end;it++)
{
*it=...
}

迭代器 Mat_ 是 Mat 的模版子类，它重载了 operator() 让我们可以更方便的取图像上的点。类似的迭代器还有 Matlterator_。

对于三通道图像的遍历：

Mat_::iteratorbegin=srcImage.begin();
Mat_::iteratorend=srcImage.end();

for(autoit=begin;it!=end;it++)
{
(*it)[0]=...//B通道
(*it)[1]=...//G通道
(*it)[2]=...//R通道
}

使用迭代器遍历图像会便捷一些，但是效率没有使用指针的效率高。

52.3.4 基于 LUT 遍历

LUT (LOOK -UP-TABLE) 意为查找表。

在数据结构中，查找表是由同一类型的 数据元素 构成的集合，它是一种以查找为“核心”，同时包括其他运算的非常灵活的数据结构。

在图像处理中，经常会通过事先建立一张查找表对图像进行映射。

例如，将灰度图由某个区间映射到另一个区间，或者将单通道映射到三通道。它们都是以像素灰度值作为索引，以灰度值映射后的数值作为表中的内容，通过索引号与映射后的输出值建立联系。

一般灰度图像会有 0-255 个灰度值，有时我们不需要这么精确的灰度级，例如黑白图像。下面我们来展示如何建立一个 LUT，将 64 到 196 之间的灰度值变成 0，其余变成 1。

Matlut(1,256,CV_8U);
for(inti=0;i64andi(i)=0;
}
else
{
lut.at(i)=i;
}
}

从上述代码可以看出，通过改变图像中像素的灰度值，LUT 可以降低灰度级提高运算速度。

LUT 只适用于 CV_8U 类型的图像。

当然，查找表并不一定都是单通道的。

如果输入图像为单通道，那么查找表为单通道。
如果输入图像为三通道，那么查找表可以为单通道或者三通道。

使用 LUT 进行遍历，采用的是颜色空间缩减的方式：把 unsigned char 类型的值除以一个 int 类型的值，得到仍然是一个 char 类型的数值。

我们采用如下的公式：

其中，Q 表示量化级别，当 Q= 10 时则灰度值 1-10 用灰度值 1 表示，灰度值 11-20 用灰度值 11 表示，以此类推。256 个灰度值的灰度图像可以用 26 个数值表示，那么彩色的图像就可以用 26 * 26 * 26 个数值表示，比原先小了很多。

#include
#include
#include

usingnamespacestd;
usingnamespacecv;

#defineQUAN_VAL110
#defineQUAN_VAL220
#defineQUAN_VAL3100

voidcreateLookupTable(Mat&table,ucharquanVal)
{
table.create(1,256,CV_8UC1);

uchar*p=table.data;
for(inti=0;i

lut.png

上述例子在创建查找表时，遍历了矩阵的每一个像素以及运用颜色空间缩减的运算公式。并且分别展示了原图、Q=10、Q=20、Q=100 的图片。可以看到当 Q = 100 时，图像压缩得比较厉害丢失了很多信息。

Part33. 图像像素值的统计

63.1 均值与标准差

均值和标准差是统计学的概念。

均值的公式：

标准差公式：

在图像处理中，它们能帮助我们了解图像通道中像素值的分布情况。均值表示图像整体的亮暗程度，图像的均值越大则表示图像越亮。标准差表示图像中明暗变化的对比程度，标准差越大表示图像中明暗变化越明显。

在图像分析的时候，我们通过图像像素值的统计，可以对图像的有效信息作出判断。当标准差很小时，图像所携带的有效信息会很少，便于我们判断这是否是我们所需要的图像。说一个题外话，曾经我看到过一段很震惊的代码，某同事写的判断传送带上手机是否亮屏。当时的代码可能是为了偷懒，只通过判断图像的均值，当均值超过某个阈值时就认为手机是亮屏的。后来我接手后，当即做了大量的修改。

下面举个例子，通过 meanStdDev() 函数获取图像的均值和标准差，以及每个通道的均值和标准差。

MatsrcImage=imread("/Users/tony/beautiful.jpg");
if(srcImage.empty())
{
cout(0,0),stddev.at(0,0));
printf("greenchannelmean:%.2f,stddev:%.2fn",mean.at(1,0),stddev.at(1,0));
printf("redchannelmean:%.2f,stddev:%.2fn",mean.at(2,0),stddev.at(2,0));