TensorFlow 图像处理和解码操作函数概述

来源：互联网发布：c语言全屏玫瑰花代码编辑：程序博客网时间：2024/06/05 16:30

TensorFlow提供提供了42个图像处理相关的函数，主要涉及解码编码，简单的图像几何变换等等。比较有特点的一个方面是有很多随机性的操作，主要增加模型的泛化能力。

原地址：Module: tf.image
定义在：tensorflow/python/ops/image_ops.py
图像处理和解码操作。
查看TensorFlow Images指南。

类：

class ResizeMethod

功能：

adjust_brightness(...): 调整RGB图像或灰度图的亮度。

adjust_contrast(...): 调整RGB图像或灰度图的对比度。

adjust_gamma(...): 在输入图像上执行伽玛校正。

adjust_hue(...): 调整RGB图像的色调。

adjust_saturation(...): 调整RGB图像的饱和度。

central_crop(...): 从图像的中央区域裁剪图像。

convert_image_dtype(...): 将图像转换为dtype，如果需要，缩放其值。

crop_and_resize(...): 对输入图像做剪裁并通过插值方法调整尺寸。

crop_to_bounding_box(...): 指定边界的裁剪图像。

decode_gif(...): 将GIF编码图像的第一帧解码为 uint8 tensor。

decode_image(...): 图像解码操作，包含了 decode_gif, decode_jpeg,和 decode_png。

decode_jpeg(...): 将jpeg编码图像解码为 uint8 tensor。

decode_png(...): 将png编码图像解码为 uint16 tensor。

draw_bounding_boxes(...): 在一个batch的图像上绘制边框。

encode_jpeg(...): JPEG图像编码。

encode_png(...): PNG图像编码。

extract_glimpse(...): 从指定的位置提取指定尺寸的区域，如果超过了原图像的尺寸，将随机填充。

flip_left_right(...): 水平翻转图像。

flip_up_down(...): 上下翻转图像。

grayscale_to_rgb(...): 单个或多个图像灰度转RGB。

hsv_to_rgb(...): 单个或多个图像HSV转RGB。

non_max_suppression(...): 根据分数降序选择边界框，分数是一个输入，函数别没有计算分数的规则，其实只是提供了一种降序选择操作。

pad_to_bounding_box(...): 补零，将图像填充到指定的宽高。

per_image_standardization(...): 图像标准化（不是归一化）。

random_brightness(...): 通过随机因子调整图像的亮度。

random_contrast(...): 通过随机因子调整图像的对比度。

random_flip_left_right(...): 随机水平翻转图像。

random_flip_up_down(...): 随机上下翻转图像。

random_hue(...): 通过随机因子调整RGB图像的色调。

random_saturation(...):通过随机因子调整RGB图像的饱和度。

resize_area(...): 应用区域插值调整图像尺寸。

resize_bicubic(...): 应用双三次插值调整图像尺寸。

resize_bilinear(...): 应用双线性内插值调整图像尺寸。

resize_nearest_neighbor(...): 应用最邻近插值调整图像尺寸。

resize_images(...): 使用指定的方法调整图像尺寸（其实包含的是上面四种插值方法）。

resize_image_with_crop_or_pad(...): 根据目标图像的宽高（自动）裁剪或填充图像。

rgb_to_grayscale(...): 单个或多个图像RGB转灰度图。

rgb_to_hsv(...): 单个或多个图像RGB转HSV。

rot90(...): 将图像逆时针旋转90度。

sample_distorted_bounding_box(...): 为图像生成单个随机变形的边界框。

total_variation(...): 计算一个图像或多个图像的总体变动（输入图像中相邻像素值的绝对差异）
transpose_image(...): 交换图像的第一维和第二维（输入要求是3D，没有batch，也就是宽和高的变换）

阅读全文

2 0