画像処理
このページは画像の管理と操作を扱うこのライブラリに存在する機能性を文書化します。注意すべきことは、明示的な画像オブジェクトがないということです。代わりに、すべてがさまざまな種類のピクセルを含む array2dオブジェクトまたはユーザー定義の 汎用イメージオブジェクトを扱います。
ピクセルタイプ
dlibのほとんどの画像処理ルーチンは、あらゆるピクセルタイプを含む画像を受け付けます。これは、可能な各ピクセルタイプに対して特性クラスpixel_traitsを定義することによって可能になります。この特性クラスは、画像処理ルーチンが各種類のピクセルをどのように扱うべきかを決定することを可能にし、それ故、pixel_traits定義を有するピクセルだけが使用され得る。以下のリストは、pixel_traits定義に付随するすべてのピクセルタイプを定義します。
- RGB
- RGBアルファ
- HSI
- LAB
- グレースケール
オブジェクト検出
オブジェクトディテクタを作成したい場合は、まずscan_fhog_pyramidツールを試してください 。使い方やトレーニングは非常に簡単で、多くの場合、優れた結果が得られます。それでも良い結果が得られない場合は、より強力な畳み込みニューラルネットワークベースの検出器を試してください 。
Pixels
- assign_pixel
- assign_pixel_intensity
- bgr_pixel
- get_pixel_intensity
- hsi_pixel
- lab_pixel
- pixel_traits
- rgb_alpha_pixel
- rgb_pixel
Image I/O
Object Detection
- correlation_tracker
- evaluate_detectors
- find_candidate_object_locations
- find_peaks
- find_points_above_thresh
- full_object_detection
- get_frontal_face_detector
- min_barrier_distance
- mmod_rect
- object_detector
- remove_unobtainable_rectangles
- Scan Image Pyramid Tools
- scan_fhog_pyramid
- scan_image
- scan_image_boxes
- scan_image_custom
- scan_image_movable_parts
- scan_image_pyramid
- setup_hashed_features
- test_box_overlap
Feature Extraction
- binned_vector_feature_image
- extract_fhog_features
- extract_highdim_face_lbp_descriptors
- extract_histogram_descriptors
- extract_uniform_lbp_descriptors
- find_bright_keypoints
- find_dark_keypoints
- fine_hog_image
- get_surf_points
- hashed_feature_image
- hog_image
- make_uniform_lbp_image
- nearest_neighbor_feature_image
- poly_image
- randomly_sample_image_features
- shape_predictor
- SURF Tools
Edges and Thresholds
- edge_orientation
- find_bright_lines
- find_dark_lines
- hough_transform
- hysteresis_threshold
- image_gradients
- normalize_image_gradients
- partition_pixels
- remove_incoherent_edge_pixels
- sobel_edge_detector
- suppress_non_maximum_edges
- threshold_image
Morphology
- binary_close
- binary_complement
- binary_difference
- binary_dilation
- binary_erosion
- binary_intersection
- binary_open
- binary_union
- encode_8_pixel_neighbors
- find_line_endpoints
- label_connected_blobs
- label_connected_blobs_watershed
- segment_image
- skeleton
Filtering
- float_spatially_filter_image_separable
- gaussian_blur
- max_filter
- separable_3x3_filter_block_grayscale
- separable_3x3_filter_block_rgb
- spatially_filter_image
- spatially_filter_image_separable
- spatially_filter_image_separable_down
- sum_filter
- sum_filter_assign
Scaling and Rotating
- add_image_left_right_flips
- add_image_rotations
- create_tiled_pyramid
- extract_image_4points
- extract_image_chips
- flip_image_dataset_left_right
- flip_image_left_right
- flip_image_up_down
- interpolate_bilinear
- interpolate_nearest_neighbor
- interpolate_quadratic
- jitter_image
- pyramid_disable
- pyramid_down
- pyramid_up
- random_cropper
- resize_image
- rotate_image
- rotate_image_dataset
- sub_image
- transform_image
- upsample_image_dataset
Visualization
- draw_fhog
- draw_line
- draw_rectangle
- draw_solid_circle
- draw_surf_points
- fill_rect
- heatmap
- jet
- randomly_color_image
- render_face_detections
- tile_images
Miscellaneous