WO2021261248A1 - 画像処理装置、画像表示システム、方法及びプログラム - Google Patents
画像処理装置、画像表示システム、方法及びプログラム Download PDFInfo
- Publication number
- WO2021261248A1 WO2021261248A1 PCT/JP2021/021875 JP2021021875W WO2021261248A1 WO 2021261248 A1 WO2021261248 A1 WO 2021261248A1 JP 2021021875 W JP2021021875 W JP 2021021875W WO 2021261248 A1 WO2021261248 A1 WO 2021261248A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- image
- resolution
- exposure time
- control unit
- processing apparatus
- Prior art date
Links
- 238000012545 processing Methods 0.000 title claims abstract description 58
- 238000000034 method Methods 0.000 title claims description 36
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 8
- 230000033001 locomotion Effects 0.000 claims description 36
- 239000002131 composite material Substances 0.000 claims description 27
- 238000006243 chemical reaction Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 13
- 238000003384 imaging method Methods 0.000 claims description 12
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 22
- 239000000203 mixture Substances 0.000 description 15
- 230000000007 visual effect Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 8
- 238000009877 rendering Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 102100024113 40S ribosomal protein S15a Human genes 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 101001118566 Homo sapiens 40S ribosomal protein S15a Proteins 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/68—Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
- H04N23/682—Vibration or motion blur correction
- H04N23/683—Vibration or motion blur correction performed by a processor, e.g. controlling the readout of an image memory
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/667—Camera operation mode switching, e.g. between still and video, sport and normal or high- and low-resolution modes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/013—Eye tracking input arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/30—Image reproducers
- H04N13/332—Displays for viewing with the aid of special glasses or head-mounted displays [HMD]
- H04N13/344—Displays for viewing with the aid of special glasses or head-mounted displays [HMD] with head-mounted left-right displays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/63—Control of cameras or camera modules by using electronic viewfinders
- H04N23/633—Control of cameras or camera modules by using electronic viewfinders for displaying additional information relating to control or operation of the camera
- H04N23/635—Region indicators; Field of view indicators
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/68—Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
- H04N23/682—Vibration or motion blur correction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/70—Circuitry for compensating brightness variation in the scene
- H04N23/741—Circuitry for compensating brightness variation in the scene by increasing the dynamic range of the image compared to the dynamic range of the electronic image sensors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/80—Camera processing pipelines; Components thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/2628—Alteration of picture size, shape, position or orientation, e.g. zooming, rotation, rolling, perspective, translation
Definitions
- This disclosure relates to an image processing device, an image display system, a method and a program.
- Japanese Unexamined Patent Publication No. 2019-029952 Japanese Unexamined Patent Publication No. 2018-186577 Japanese Patent No. 4334950 Japanese Unexamined Patent Publication No. 2000-032318 Japanese Patent No. 5511205
- the load of image processing in the ISP becomes more than necessary by performing the resolution conversion processing only on the part other than the region of interest obtained by the eye tracking system to reduce the resolution. It prevented it from going up.
- This technology was made in view of such a situation, and is an image processing device, an image display system, a method, and an image processing apparatus, an image display system, a method, and an image processing apparatus capable of obtaining a blur reduction effect and an HDR effect while reducing the processing load on image processing.
- the purpose is to provide a program.
- the image processing apparatus of the embodiment is a first image input from an image sensor, which is captured at the first exposure time and has a first resolution, and an image corresponding to a part of a region of the first image. It is provided with a control unit that generates a composite image obtained by combining a second image that is imaged with a second exposure time shorter than the first exposure time and has a second resolution higher than the first resolution, and outputs the composite image to a display device. ..
- FIG. 1 is a schematic block diagram of the head-mounted display system of the embodiment.
- FIG. 2 is an explanatory diagram of a VR head-mounted display system showing an arrangement state of cameras.
- FIG. 3 is an explanatory diagram of an example of the image display operation of the embodiment.
- FIG. 4 is an explanatory diagram of Variable Foveated Rendering.
- FIG. 5 is an explanatory diagram of Fixed Foveated Rendering.
- FIG. 6 is an explanatory diagram of motion compensation using optical flow.
- FIG. 7 is an explanatory diagram of motion compensation using the self-position.
- FIG. 8 is an explanatory diagram of image composition.
- FIG. 9 is an explanatory diagram of the shooting order of the low-resolution image and the high-resolution image in the above embodiment.
- FIG. 10 is an explanatory diagram of the shooting order of other low-resolution images and high-resolution images.
- FIG. 11 is an explanatory diagram of the shooting order of still another low-resolution image and high-re
- FIG. 1 is a schematic block diagram of a VR head-mounted display system according to an embodiment.
- FIG. 1 illustrates a personal computer-connected VR head-mounted display system.
- the VR head-mounted display system 10 is roughly classified into a head-mounted display (hereinafter referred to as an HMD unit) 11 and an information processing device (hereinafter referred to as a PC unit) 12.
- the PC unit 12 functions as a control unit that controls the HMD unit 11.
- the HMD unit 11 includes an IMU (Inertial Measurement Unit) 21, a camera 22 for SLAM (Simultaneous Localization And Mapping), a VST (Video See-Through) camera 23, an eye tracking camera 24, and a display 25. There is.
- IMU Inertial Measurement Unit
- SLAM Simultaneous Localization And Mapping
- VST Video See-Through
- the IMU 21 is a so-called motion sensor, which senses the state of the user and outputs the sensing result to the PC unit 12.
- the IMU 21 has, for example, a 3-axis gyro sensor and a 3-axis acceleration sensor, and outputs user motion information (sensor information) corresponding to the detected three-dimensional angular velocity, acceleration, etc. to the PC unit 12.
- FIG. 2 is an explanatory diagram of a VR head-mounted display system showing an arrangement state of cameras.
- the SLAM camera 22 is a camera called SLAM for simultaneously performing self-position estimation and environment map creation, and acquiring an image to be used in a technique for obtaining a self-position from a state where there is no prior information such as map information. be.
- the SLAM camera is arranged, for example, in the central portion of the front surface of the HMD unit 11, and collects information for simultaneously performing self-position estimation and environmental map creation based on changes in the image in front of the HMD unit 11. .. SLAM will be described in detail later.
- the VST camera 23 acquires a VST image, which is an external image, and outputs the VST image to the PC unit 12.
- the VST camera 23 includes a lens installed outside the HMD unit 11 for VST and an image sensor 23A (see FIG. 3). As shown in FIG. 2, a pair of VST cameras 23 are provided so as to correspond to the positions of both eyes of the user.
- the imaging conditions (resolution, imaging area, imaging timing, etc.) of the VST camera 23 and eventually the image sensor are controlled by the PC unit 12.
- the image sensor 23A (see FIG. 3) constituting the VST camera 23 of the present embodiment has a high resolution but high processing load full resolution mode and a low resolution but processing load as operation modes. Has a low pixel addition mode. Then, the image sensor 23A can switch between the full resolution mode and the pixel addition mode on a frame-by-frame basis under the control of the PC unit 12.
- the pixel addition mode is one of the drive modes of the image sensor 23A, and an image having a longer exposure time and less noise can be obtained as compared with the full resolution mode.
- 2 ⁇ 2 addition mode As an example of the pixel addition mode, 2 ⁇ 2 pixels (4 pixels in total) are added and averaged and output as 1 pixel, so that the resolution is 1/4 and the amount of noise is about 1. An image that is halved is output.
- 4x4 addition mode 4x4 pixels (16 pixels in total) are added and averaged and output as one pixel, so an image with a resolution of 1/16 and a noise amount of about 1/4 is output.
- the eye tracking camera 24 is a camera for tracking the user's line of sight, so-called eye tracking.
- the eye tracking camera 24 is configured as a non-visible light camera or the like.
- the eye tracking camera 24 is used to detect a user's region of interest using a technique such as Variable Foveated Rendering. According to the recent eye tracking camera 24, the line-of-sight direction can be acquired with an accuracy of about ⁇ 0.5 °.
- the display 25 is a display device that displays a processed image of the PC unit 12.
- the PC unit 12 includes a self-position estimation unit 31, an attention area determination unit 32, an ISP (Image Signal Processor) 33, a motion compensation unit 34, a frame memory 35, and an image composition unit 36.
- ISP Image Signal Processor
- the self-position estimation unit 31 estimates the self-position including the posture of the user based on the sensor information output by the IMU 21 and the SLAM image acquired by the SLAM camera 22.
- the three-dimensional position of the HMD unit 11 is estimated using both the sensor information output by the IMU 21 and the SLAM image acquired by the SLAM camera 22.
- some methods such as VO (Visual Odometry) using only the camera image and VIO (Visual Inertial Odometry) using both the camera image and the output of IMU21 can be considered.
- the attention area determination unit 32 determines the user's attention area based on the eye tracking result image of both eyes, which is the output of the eye tracking camera 24, and outputs it to the ISP 33.
- the ISP 33 designates a region of interest in the imaging region of the VST camera 23 based on the region of interest of the user determined by the region of interest 32.
- the ISP 33 processes the image signal output by the VST camera 23 and outputs it as a processed image signal. Specifically, as image signal processing, “noise removal”, “demosaic”, “white balance”, “exposure adjustment”, “contrast enhancement”, “gamma correction” and the like are performed. Due to the heavy processing load, mobile devices are often equipped with dedicated hardware.
- the motion compensation unit 34 performs motion compensation for the processed image signal and outputs the processed image signal based on the position of the HMD unit 11 estimated by the self-position estimation unit 31.
- the frame memory 35 stores the processed image signal after motion compensation in frame units.
- FIG. 3 is an explanatory diagram of an example of the image display operation of the embodiment.
- the attention area determination unit is based on at least the user's line-of-sight direction among the user's line-of-sight direction and the characteristics of the display 25 based on the eye-tracking result image of both eyes, which is the output of the eye-tracking camera 24. 32 determines the area of interest of the user and outputs it to the VST camera (step S11).
- the attention area determination unit 32 estimates the attention area using the eye tracking result images of both eyes obtained by the eye tracking camera 24.
- FIG. 4 is an explanatory diagram of Variable Foveated Rendering. As shown in FIG. 4, the captured image of the VST camera 23 has a right-eye image RDA and a left-eye image LDA.
- the effective visual field area SAR adjacent to the central visual field area CAR is adjacent to the central visual field area CAR, and the user's line-of-sight direction. It is divided into three regions, the peripheral visual field region PAR, which is a distant region. Then, since the resolution effectively required decreases in the order of the central visual field region CAR ⁇ the effective visual field region SAR ⁇ the peripheral visual field region PAR from the center in the line-of-sight direction, the highest resolution is set for at least all of the central visual field region CAR. Treat as an area of interest. Further, as it goes outside the field of view, it draws at a lower resolution.
- FIG. 5 is an explanatory diagram of Fixed Foveated Rendering. If an eye tracking system such as the eye tracking camera 24 cannot be used, the area of interest is determined according to the display characteristics.
- the lens is designed so that the center of the screen of the display has the highest resolution and the resolution decreases as it gets closer to the periphery, so the center of the screen of the display is fixed as the area of interest. Then, as shown in FIG. 5, the central region is defined as the maximum resolution region ARF with full resolution.
- the resolution in the horizontal direction is higher than that in the vertical direction
- the resolution in the downward direction is higher than that in the upward direction, according to the general tendency of the user's line-of-sight orientation.
- the display is performed according to the general characteristics of the visual field of the user.
- the VST camera 23 of the HMD unit 11 starts imaging by the image sensor 23A and outputs the captured image to the ISP 33 (step S12). Specifically, the VST camera 23 sets the imaging mode of the image sensor 23A to the pixel addition mode, and captures one low-resolution and low-noise image (hereinafter referred to as low-resolution image LR) taken at all angles of view (one frame). Equivalent) and output to ISP33.
- low-resolution image LR low-resolution image
- the VST camera 23 sets the imaging mode to the full resolution mode, and a plurality of high-resolution images captured only in the angle of view range corresponding to the determined region of interest (in the example of FIG. 3, the high-resolution images HR1 to (3 images of HR3) are acquired and sequentially output to ISP33.
- a time of 1/240 sec is allocated to acquire one low-resolution image LR with the imaging mode as the pixel addition mode, and three high-resolution images HR1 to HR3 are acquired with the imaging mode as the full-resolution mode.
- the ISP 33 performs motion compensation on the image signal output by the VST camera 23 by performing "noise removal”, “demosaic”, “white balance”, “exposure adjustment”, “contrast enhancement”, “gamma correction”, and the like. Output to unit 34 (step S13).
- the motion compensation unit 34 compensates for the misalignment of the subject (motion compensation) due to the different shooting timings of the plurality of images (four images in the above example) (step S14).
- both the movement of the head of the user wearing the HMD unit 11 and the movement of the subject can be considered as the reason for the misalignment, but here, the movement of the user's head is dominant (more influential). It is assumed that it is large).
- the first method is a method using optical flow
- the second method is a method using self-position.
- FIG. 6 is an explanatory diagram of motion compensation using optical flow.
- the optical flow is a vector (in the present embodiment, an arrow in FIG. 6) representing the movement of an object (subject including a person) in a moving image.
- a block matching method, a gradient method, or the like is used for vector extraction.
- the optical flow is obtained from the captured image of the VST camera 23, which is an external camera. Then, motion compensation is performed by deforming the image so that the same subject overlaps.
- the transformation here can be considered as a method of obtaining the optical flow of the entire screen in pixel units using simple translation, homography transformation, or local optical flow.
- FIG. 7 is an explanatory diagram of motion compensation using the self-position.
- motion compensation is performed using the self-position, the amount of movement of the HMD unit 11 between the timings at which a plurality of images are taken using the captured image of the VST camera 23 which is a camera image or the IMU 21 is obtained.
- the homography transformation means projecting a plane onto another plane using a projective transformation.
- the motion parallax differs depending on the distance between the subject and the camera, so the depth of the object of interest is used as a typical distance.
- the depth (Depth) is acquired by eye tracking or screen averaging.
- the surface corresponding to the distance is called Stabilization Plane.
- motion compensation is performed by performing homography transformation so as to give motion parallax according to the representative distance.
- the image synthesizing unit 36 synthesizes one low-resolution image photographed at all angles of view in the pixel addition mode and a plurality of high-resolution images photographed only in the region of interest at full resolution (step S15).
- image composition as will be described in detail below, HDR conversion processing (step S15A) and high resolution processing (step S15B) are performed.
- FIG. 8 is an explanatory diagram of image composition.
- enlargement processing of a low-resolution image is performed in order to match the resolution (step S21).
- the low-resolution image LR is enlarged to generate an enlarged low-resolution image ELR.
- the high-resolution images HR1 to HR3 are aligned, and then a plurality of images HR1 to HR3 are added and averaged to create one high-resolution image HRA (step S22).
- HDR conversion process the HDR conversion process using exposed images having different exposure times is a general process in recent years, and will be briefly described here.
- the basic idea of the HDR conversion process is to synthesize images so that the blend ratio of the long-exposure image (low-resolution image LR in the present embodiment) is high in the low-brightness region in the screen, and the high-brightness region is short-exposure.
- the images are combined so that the blending ratio of the images (high-resolution image HRA in the present embodiment) is high.
- HRA high-resolution image
- step S15A range adjustment and bit expansion are performed on the enlarged low-resolution image ELR and the high-resolution image HRA (steps S23 and S24). This is to match the luminance range and secure the band with the expansion of the dynamic range.
- an ⁇ map representing the luminance distribution in pixel units is generated for each of the enlarged low-resolution image ELR and the high-resolution image HRA (step S25). Then, based on the luminance distribution corresponding to the generated ⁇ map, ⁇ blending for synthesizing the enlarged low-resolution image ELR and the high-resolution image HRA is performed (step S26).
- the blend ratio of the enlarged low-resolution image ELR which is a long-exposure image
- the blend ratio of the high-resolution image HRA which is a short-exposure image
- the image is set so that the blend ratio of the high-resolution image HRA, which is a short-exposure image, is higher than the blend ratio of the enlarged low-resolution image ELR, which is a long-exposure image, based on the generated ⁇ -map. Combine in pixel units.
- both the low-resolution image LR, which is the first image, and the high-resolution images HR1 to HR3, which are the second images, have been effectively subjected to HDR conversion processing.
- At least one of the low-resolution image LR which is the first image and the high-resolution images HR1 to HR3 which are the second images may be subjected to HDR conversion processing.
- the low-resolution image with a long exposure time and the high-resolution image with a short exposure time are combined with each other's good points according to the frequency domain of the subject. It is done by.
- the enlarged low-resolution image ELR is exposed for a long time and has a high signal-to-noise ratio, so it is often used in the low-frequency region.
- the high-resolution image HRA is frequency-separated by a high-pass filter (step S28), and the high-frequency component of the high-resolution image HRA separated by the high-frequency component is added to the image after ⁇ -blending (step S29).
- a resolution conversion process is performed, and further a resolution conversion process is performed to generate a display image DG (step S16), which is output to the display 25 in real time (step S17).
- to output in real time means to follow the movement of the user and output so that the display is performed without the user feeling a sense of discomfort.
- the external camera (the VST camera 23 in the present embodiment is effective) while suppressing the information of the motion blur due to the movement of the user and the transferred image data rate due to the high resolution.
- the dynamic range can be comparable to the dynamic range in the real field.
- FIG. 9 is an explanatory diagram of the shooting order of the low-resolution image and the high-resolution image in the above embodiment.
- the low-resolution image LR is photographed first, and then the three high-resolution images HR1 to HR3 are photographed.
- the high-resolution images HR1 to HR3 which include the general contents of the image to be photographed and are combined after the image of the low-resolution image LR, which is the reference of the image composition at the time of image composition such as motion compensation, are photographed.
- the exposure conditions of the high-resolution images HR1 to HR3 according to the exposure conditions of the low-resolution images LR, and it is possible to obtain a composite image with less discomfort after compositing.
- FIG. 10 is an explanatory diagram of the shooting order of other low-resolution images and high-resolution images.
- all the high-resolution images HR1 to HR3 are photographed after the low-resolution image LR is photographed, but in the example of FIG. 10, the low-resolution image LR is photographed after the high-resolution image HR1 is photographed. After that, the high-resolution image HR2 and the high-resolution image HR3 are photographed.
- the time difference between the shooting timings of the high-resolution images HR1 to HR3 with respect to the shooting timing of the low-resolution image LR, which is the basis of image composition, is reduced, and by extension, the temporal distance (and the moving distance of the subject) when performing motion compensation. ) Is shortened, so that it is possible to obtain a composite image with improved motion compensation accuracy.
- the same effect can be obtained by shooting the low-resolution image LR after shooting the high-resolution image HR1 and the high-resolution image HR2, and then shooting the high-resolution image HR3. ..
- the same effect can be obtained by controlling the image sensor so that the second images HR1 to HR3 are imaged before and after the image of the low-resolution image LR which is the first image. More specifically, when multiple high-resolution images are shot, the number of high-resolution images shot before the shooting timing of the low-resolution image LR and the high-resolution image shot after the shooting timing of the low-resolution image LR. If the difference between the number of shots and the number of shots is smaller (more preferably the same number), the same effect can be obtained.
- FIG. 11 is an explanatory diagram of the shooting order of still another low-resolution image and high-resolution image.
- all the high-resolution images HR1 to HR3 are photographed after the low-resolution images LR are photographed, but in the example of FIG. 11, conversely, after the high-resolution images HR1 to HR3 are photographed, the low-resolution images are taken. I am shooting LR.
- the latency (delay time) with respect to the actual movement of the subject in the low-resolution image LR which is the basis of image composition, can be minimized, and the deviation between the displayed image by the composite image and the actual movement of the subject is the smallest.
- Nature can display images.
- three high-resolution images HR1 to HR3 are imaged for one low-resolution image LR and combined, but for one low-resolution image LR.
- the same effect can be obtained by capturing one or four or more low-resolution images and synthesizing them.
- the present technology can be configured as follows.
- An image processing device provided with a control unit that generates a composite image obtained by combining a second image that is imaged at a second exposure time and has a second resolution higher than the first resolution, and outputs the composite image to a display device. ..
- (3) The control unit applies motion compensation to the second image based on the imaging timing of the first image.
- the image processing apparatus receives a plurality of the second images corresponding to the first image, and generates a composite image in which the first image and the plurality of second images are combined.
- the image processing apparatus according to any one of (1) to (3).
- the control unit controls the image sensor so that the first image is captured prior to the second image.
- the image processing apparatus according to any one of (1) to (4).
- the control unit controls the image sensor so that the second image is captured prior to the first image.
- the image processing apparatus according to any one of (1) to (4).
- the control unit controls the image sensor so that the second image is captured before and after the first image is captured. (4) The image processing apparatus according to the above.
- the control unit performs enlargement processing so that the resolution of the first image becomes the second resolution. After performing the addition averaging of the plurality of the second images, the composite image is generated.
- the image processing apparatus according to the above.
- the area is a predetermined area of interest or an area of interest based on the user's line-of-sight direction.
- the image processing apparatus according to any one of (1) to (8).
- the control unit generates the composite image and outputs the composite image to the display device in real time.
- the image processing apparatus according to any one of (1) to (9).
- (11) A first image having an image sensor and having a first resolution captured in the first exposure time and an image corresponding to a part of the region of the first image, the second exposure shorter than the first exposure time.
- An image pickup device that is imaged in time and outputs a second image having a second resolution higher than the first resolution.
- An image processing device provided with a control unit that generates and outputs a composite image obtained by synthesizing the first image and the second image.
- a display device that displays the input composite image and Image display system with.
- the image pickup device is attached to the user and is attached to the user.
- the image display system includes a line-of-sight direction detection device that detects the line-of-sight direction of the user. The area is set based on the line-of-sight direction.
- (11) The image display system according to the above. (13) It is a method executed by an image processing device that controls an image sensor.
- (14) A program for controlling an image processing device that controls an image sensor by a computer.
- the computer A first image imaged at the first exposure time and having a first resolution, and an image corresponding to a part of a region of the first image, which is imaged at a second exposure time shorter than the first exposure time.
- VR head-mounted display system image display system
- HMD section Head-mounted display
- Information processing device PC section
- IMU Information processing device
- SLAM camera 23
- VST camera 23A
- image sensor 24
- eye tracking camera 25
- display 31
- self-position estimation unit 32
- ISP 34 Compensation section 35
- Frame memory 36
- Image compositing section AR area
- ARF Highest resolution area CAR Central field view area
- DG Display image ELR Enlarged low resolution image HR1 to HR3, HRA High resolution image
- LDA Left eye image LR
- Low resolution image PAR Peripheral field view area
- RDA Right eye Image SAR effective viewing area
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Studio Devices (AREA)
- Optics & Photonics (AREA)
- Image Processing (AREA)
Abstract
実施形態の画像処理装置は、イメージセンサから入力された、第1露光時間で撮像されて第1解像度を有する第1画像と、第1画像の一部の領域に相当する画像であって、第1露光時間よりも短い第2露光時間で撮像されて第1解像度よりも高い第2解像度を有する第2画像とを合成した合成画像を生成し、合成画像を表示装置に出力する制御部を備える。
Description
本開示は、画像処理装置、画像表示システム、方法及びプログラムに関する。
従来、主としてVST(Video See-Through)システムに用いられることを想定し、アイトラッキングシステムにより推定した視線位置により注目領域を算出し、撮影後に非注目領域のみ画像を間引く処理(解像度変換処理)を施し、画像処理にかかる処理負荷を低減できる技術が提案されている(例えば、特許文献1参照)。
上記従来の技術においては、アイトラッキングシステムにより得られた注目領域以外の部分のみに対し解像度変換処理を施し、低解像度化することにより、ISP(Image Signal Processor)における画像処理の負荷が必要以上に上がってしまうことを防いでいた。
したがって、上記従来の手法では、注目領域と非注目領域は常に露光条件が等しいのでブラー削減効果が得られず、HDR(High Dynamic Range)効果が得られないという問題点があった。
本技術は、このような状況に鑑みてなされたものであり、画像処理にかかる処理負荷を低減しつつ、ブラー削減効果及びHDR効果を得ることが可能な画像処理装置、画像表示システム、方法及びプログラムを提供することを目的としている。
実施形態の画像処理装置は、イメージセンサから入力された、第1露光時間で撮像されて第1解像度を有する第1画像と、第1画像の一部の領域に相当する画像であって、第1露光時間よりも短い第2露光時間で撮像されて第1解像度よりも高い第2解像度を有する第2画像とを合成した合成画像を生成し、合成画像を表示装置に出力する制御部を備える。
以下、図面を参照して、実施形態について詳細に説明する。
図1は、実施形態のVRヘッドマウントディスプレイシステムの概要構成ブロック図である。
図1においては、パーソナルコンピュータ接続型のVRヘッドマウントディスプレイシステムを例示している。
図1は、実施形態のVRヘッドマウントディスプレイシステムの概要構成ブロック図である。
図1においては、パーソナルコンピュータ接続型のVRヘッドマウントディスプレイシステムを例示している。
VRヘッドマウントディスプレイシステム10は、大別すると、ヘッドマウントディスプレイ(以下、HMD部という)11と、情報処理装置(以下、PC部という)12と、を備えている。
ここで、PC部12は、HMD部11を制御する制御部として機能している。
ここで、PC部12は、HMD部11を制御する制御部として機能している。
HMD部11は、IMU(Inertial Measurement Unit)21と、SLAM(Simultaneous Localization And Mapping)用カメラ22と、VST(Video See-Through)カメラ23と、アイトラッキングカメラ24と、ディスプレイ25と、を備えている。
IMU21は、いわゆるモーションセンサであり、ユーザの状態等をセンシングし、センシング結果をPC部12に出力する。
IMU21は、例えば、3軸ジャイロセンサおよび3軸加速度センサを有し、検出した3次元の角速度、加速度等に対応するユーザの動き情報(センサ情報)をPC部12に出力する。
IMU21は、例えば、3軸ジャイロセンサおよび3軸加速度センサを有し、検出した3次元の角速度、加速度等に対応するユーザの動き情報(センサ情報)をPC部12に出力する。
図2は、カメラの配置状態を表すVRヘッドマウントディスプレイシステムの説明図である。
SLAM用カメラ22は、SLAMと称される自己位置推定と環境地図作成とを同時に行い、地図情報などの事前情報がない状態から自己位置を求める技術に用いるための画像を取得するためのカメラである。SLAM用カメラは、例えば、HMD部11の前面の中央部に配置されており、HMD部11の前方の画像の変化に基づいて自己位置推定と環境地図作成とを同時に行うための情報収集を行う。SLAMについては、後に詳述する。
SLAM用カメラ22は、SLAMと称される自己位置推定と環境地図作成とを同時に行い、地図情報などの事前情報がない状態から自己位置を求める技術に用いるための画像を取得するためのカメラである。SLAM用カメラは、例えば、HMD部11の前面の中央部に配置されており、HMD部11の前方の画像の変化に基づいて自己位置推定と環境地図作成とを同時に行うための情報収集を行う。SLAMについては、後に詳述する。
VSTカメラ23は、外部画像であるVST画像を取得してPC部12に出力する。
VSTカメラ23は、VST用にHMD部11外側に設置されたレンズとイメージセンサ23A(図3参照)と、を備えている。VSTカメラ23は、図2に示すように、ユーザの両目の位置に対応するように一対設けられている。
VSTカメラ23は、VST用にHMD部11外側に設置されたレンズとイメージセンサ23A(図3参照)と、を備えている。VSTカメラ23は、図2に示すように、ユーザの両目の位置に対応するように一対設けられている。
この場合において、VSTカメラ23、ひいては、イメージセンサの撮像条件(解像度、撮像領域、撮像タイミング等)は、PC部12により制御されている。
本実施形態のVSTカメラ23を構成しているイメージセンサ23A(図3参照)は、動作モードとして、高解像度であるが処理負荷の高いフル(Full)解像度モードと、低解像度であるが処理負荷の低い画素加算モードと、を有している。
そして、イメージセンサ23Aは、PC部12の制御下で、フル解像モードと、画素加算モードと、をフレーム単位で切り替えることができる。
そして、イメージセンサ23Aは、PC部12の制御下で、フル解像モードと、画素加算モードと、をフレーム単位で切り替えることができる。
この場合において、画素加算モードは、イメージセンサ23Aの駆動モードの一つであり、フル解像度モードに比較して、露光時間が長く、ノイズが少ない画像が得られることとなる。
具体的には、画素加算モードの一例としての2×2加算モードでは縦横2×2画素(全4画素)を加算平均して1画素として出力するため、解像度が1/4、ノイズ量が約1/2となった画像が出力される。同様に4×4加算モードでは縦横4×4画素(全16画素)を加算平均して1画素として出力するため、解像度が1/16、ノイズ量が約1/4となった画像が出力される。
アイトラッキングカメラ24は、ユーザの視線を追跡、いわゆるアイトラッキング(eye tracking)を行うためのカメラである。アイトラッキングカメラ24は、可視光外カメラ等として構成されている。
アイトラッキングカメラ24は、Variable Foveated Rendering等の手法を用いてユーザの注目領域を検出するために用いられる。近年のアイトラッキングカメラ24によれば、±0.5°程度の精度で視線方向が取得できる。
ディスプレイ25は、PC部12の処理後の画像を表示する表示装置である。
ディスプレイ25は、PC部12の処理後の画像を表示する表示装置である。
PC部12は、自己位置推定部31と、注目領域決定部32と、ISP(Image Signal Processor)33と、動き補償部34と、フレームメモリ35と、画像合成部36と、を備えている。
自己位置推定部31は、IMU21が出力したセンサ情報及びSLAM用カメラ22が取得したSLAM用画像に基づいてユーザの姿勢等を含む自己位置を推定する。
本実施形態においては、自己位置推定部31の自己位置推定の手法として、IMU21が出力したセンサ情報及びSLAM用カメラ22が取得したSLAM用画像の双方を用いてHMD部11の3次元位置を推定する手法を用いているが、カメラ画像のみを用いるVO(Visual Odometry)、カメラ画像及びIMU21の出力の両方を用いるVIO(Visual Inertial Odometry)等、いくつかの手法が考えられる。
注目領域決定部32は、アイトラッキングカメラ24の出力である両眼のアイトラッキング結果像に基づいて、ユーザの注目領域を決定して、ISP33に出力する。
ISP33は、注目領域決定部32が決定したユーザの注目領域に基づいて、VSTカメラ23の撮像領域における注目領域を指定する。
ISP33は、注目領域決定部32が決定したユーザの注目領域に基づいて、VSTカメラ23の撮像領域における注目領域を指定する。
また、ISP33は、VSTカメラ23の出力した画像信号の処理を行って処理済画像信号として出力する。具体的には、画像信号の処理としては、「ノイズ除去」、「デモザイク」、「ホワイトバランス」、「露出調整」、「コントラスト強調」、「ガンマ補正」等を行う。処理負荷が大きいため、モバイル機器では、基本的に専用のハードウェアが用意されていることが多い。
動き補償部34は、自己位置推定部31の推定したHMD部11の位置に基づいて、処理済画像信号の動き補償を行って出力する。
フレームメモリ35は、動き補償後の処理済み画像信号をフレーム単位で記憶する。
フレームメモリ35は、動き補償後の処理済み画像信号をフレーム単位で記憶する。
図3は、実施形態の画像表示動作の一例の説明図である。
所定の撮像開始タイミング前において、アイトラッキングカメラ24の出力である両眼のアイトラッキング結果像に基づくユーザの視線方向及びディスプレイ25の特性のうち、少なくともユーザの視線方向に基づいて、注目領域決定部32がユーザの注目領域を決定してVSTカメラに出力する(ステップS11)。
所定の撮像開始タイミング前において、アイトラッキングカメラ24の出力である両眼のアイトラッキング結果像に基づくユーザの視線方向及びディスプレイ25の特性のうち、少なくともユーザの視線方向に基づいて、注目領域決定部32がユーザの注目領域を決定してVSTカメラに出力する(ステップS11)。
より具体的には、注目領域決定部32は、アイトラッキングカメラ24により得られた両眼のアイトラッキング結果像を用いて注目領域の推定を行う。
図4は、Variable Foveated Renderingの説明図である。
図4に示すように、VSTカメラ23の撮像画像は、右目画像RDA及び左目画像LDAを有している。
図4に示すように、VSTカメラ23の撮像画像は、右目画像RDA及び左目画像LDAを有している。
そしてアイトラッキングカメラ24のアイトラッキング検出結果に基づくユーザの視線方向に基づいて、ユーザの視線方向を中心とする中心視野領域CAR、中心視野領域CARに隣接する有効視野領域SAR及びユーザの視線方向から離れた領域である周辺視野領域PARの三つの領域に分ける。そして、視線方向中心から中心視野領域CAR→有効視野領域SAR→周辺視野領域PARの順で実効的に要求される解像度が低下するので、少なくとも中心視野領域CARの全てについては最も解像度が高く設定される注目領域として取り扱う。さらに視野の外側に行くにしたがって低解像度で描画をする。
図5は、Fixed Foveated Renderingの説明図である。
アイトラッキングカメラ24等のアイトラッキングシステムが使用できない場合は、ディスプレイ特性に応じて注目領域の決定を行う。
アイトラッキングカメラ24等のアイトラッキングシステムが使用できない場合は、ディスプレイ特性に応じて注目領域の決定を行う。
一般的に、ディスプレイの画面中心が最も解像度が高く、周辺に近づくほど解像度が下がるようにレンズが設計されているので、ディスプレイの画面中心を注目領域として固定する。そして、図5に示すように、中心領域をフル解像度の最高解像度領域ARFとしている。
さらに原則的には、ユーザの視線方向の向きやすさの一般的な傾向に応じて、上下方向よりは左右方向の解像度を高くし、上方向よりは、下方向の解像度を高くするようにしている。
すなわち、図5に示すように、最高解像度領域ARFの半分の解像度を有する領域AR/2、最高解像度領域ARFの1/4の解像度を有する領域AR/4、最高解像度領域ARFの1/8の解像度を有する領域AR/8及び最高解像度領域ARFの1/16の解像度を有する領域AR/16を配置することで、ユーザである人の視野の一般的な特性に沿った表示を行っている。
以上の説明のように、いずれの方式においても、高解像度の描画(レンダリング)を必要十分な領域にとどめている。これにより、PC部12における描画負荷を大幅に軽減できるので、PC部12に要求されるスペックのハードルが下がることやパフォーマンス向上が望める。
続いて、HMD部11のVSTカメラ23は、イメージセンサ23Aにより撮像を開始し、撮像画像をISP33に出力する(ステップS12)。
具体的には、VSTカメラ23は、イメージセンサ23Aにおける撮像モードを画素加算モードとし、全画角撮影された低解像度かつ低ノイズの画像(以下、低解像度画像LRという)を1枚(1フレーム相当)取得し、ISP33に出力する。
具体的には、VSTカメラ23は、イメージセンサ23Aにおける撮像モードを画素加算モードとし、全画角撮影された低解像度かつ低ノイズの画像(以下、低解像度画像LRという)を1枚(1フレーム相当)取得し、ISP33に出力する。
続いて、VSTカメラ23は、撮像モードをフル解像度モードとし、決定された注目領域に対応する画角範囲のみ撮影された高解像度の画像を複数枚(図3の例では、高解像度画像HR1~HR3の3枚)取得し、順次ISP33に出力する。
この場合において、例えば、1フレームの処理時間を1/60sec(=60Hz)とした場合には、処理速度を1/240sec(=240Hz)とした場合を例とする。
この場合に、撮像モードを画素加算モードとして1枚の低解像度画像LRを取得するのに1/240secの時間を割り当て、撮像モードをフル解像度モードとして3枚の高解像度画像HR1~HR3を取得するのに3/240secの時間を割り当て、合計1/60sec(=4/240)、すなわち、1フレームの処理時間で処理を行うようにしている。
この場合に、撮像モードを画素加算モードとして1枚の低解像度画像LRを取得するのに1/240secの時間を割り当て、撮像モードをフル解像度モードとして3枚の高解像度画像HR1~HR3を取得するのに3/240secの時間を割り当て、合計1/60sec(=4/240)、すなわち、1フレームの処理時間で処理を行うようにしている。
続いてISP33は、VSTカメラ23の出力した画像信号に対し、「ノイズ除去」、「デモザイク」、「ホワイトバランス」、「露出調整」、「コントラスト強調」あるいは「ガンマ補正」等を行って動き補償部34に出力する(ステップS13)。
動き補償部34は、複数(上述の例の場合、4枚)の画像の撮影タイミングが異なることによる被写体の位置ずれの補償(動き補償)を行う(ステップS14)。
この場合において、位置ずれが生じる理由としては、HMD部11を装着しているユーザの頭の動き及び被写体の動きの双方が考えられるが、ここではユーザの頭の動きが支配的(より影響が大きい)であるものとする。
この場合において、位置ずれが生じる理由としては、HMD部11を装着しているユーザの頭の動き及び被写体の動きの双方が考えられるが、ここではユーザの頭の動きが支配的(より影響が大きい)であるものとする。
動き補償の方法としては、例えば、2通り考えられる。
第1の方法は、オプティカルフロー(optical flow)を用いる方法であり、第2の方法は、自己位置を用いる方法である。
以下、それぞれについて説明する。
第1の方法は、オプティカルフロー(optical flow)を用いる方法であり、第2の方法は、自己位置を用いる方法である。
以下、それぞれについて説明する。
図6は、オプティカルフローを用いた動き補償の説明図である。
オプティカルフローとは、動画像において物体(人物を含む被写体)の動きをベクトル(本実施形態においては、図6中における矢印)で表したものである。ここで、ベクトルの抽出には、ブロックマッチング法、勾配法などが用いられる。
オプティカルフローとは、動画像において物体(人物を含む被写体)の動きをベクトル(本実施形態においては、図6中における矢印)で表したものである。ここで、ベクトルの抽出には、ブロックマッチング法、勾配法などが用いられる。
オプティカルフローを用いた動き補償においては、図6に示すように、外部カメラであるVSTカメラ23の撮像画像からオプティカルフローを求める。そして同じ被写体が重なるように画像を変形することにより動き補償を行う。
ここでいう変形とは、単純な平行移動や、ホモグラフィ変換、ローカルなオプティカルフローを用いてピクセル単位で画面全体のオプティカルフローを求める方法などが考えられる。
図7は、自己位置を用いた動き補償の説明図である。
自己位置を用いて動き補償を行う場合には、カメラ画像であるVSTカメラ23の撮像画像やIMU21を用いて複数画像を撮影したタイミング間のHMD部11の移動量を求める。
自己位置を用いて動き補償を行う場合には、カメラ画像であるVSTカメラ23の撮像画像やIMU21を用いて複数画像を撮影したタイミング間のHMD部11の移動量を求める。
そして求めたHMD部11の移動量に応じたホモグラフィ変換を行うというものである。ここで、ホモグラフィ変換とは、平面を射影変換を用いて別の平面に射影することをいう。
ここで、2次元画像のホモグラフィ変換を行う場合、被写体とカメラの距離に応じて運動視差が異なるため、注目物体のデプスを代表的な距離とする。ここで、デプス(Depth:深度)は、アイトラッキング又は画面平均により取得する。この場合において、当該距離に対応する面をStabilization Planeと呼ぶ。
そして、当該代表的な距離に応じた運動視差を与えるようにホモグラフィ変換を行うことにより動き補償を行う。
続いて画像合成部36は、画素加算モードで全画角撮影された低解像度画像一枚と、フル解像度で注目領域のみ撮影された高解像度画像複数枚の合成を行う(ステップS15)。
この画像合成においては、以下に詳述するが、HDR化処理(ステップS15A)及び高解像度化処理(ステップS15B)を行う。
この画像合成においては、以下に詳述するが、HDR化処理(ステップS15A)及び高解像度化処理(ステップS15B)を行う。
図8は、画像合成の説明図である。
画像合成を行うに際しては、解像度を合わせるために低解像度画像の拡大処理を行う(ステップS21)。
画像合成を行うに際しては、解像度を合わせるために低解像度画像の拡大処理を行う(ステップS21)。
具体的には、低解像度画像LRの拡大を行って、拡大低解像度画像ELRを生成する。
一方、高解像度画像HR1~HR3は、位置合わせを行った上で、複数枚の画像HR1~HR3を加算平均して一枚の高解像度画像HRAを作成する(ステップS22)。
一方、高解像度画像HR1~HR3は、位置合わせを行った上で、複数枚の画像HR1~HR3を加算平均して一枚の高解像度画像HRAを作成する(ステップS22)。
画像合成の際に考慮すべき要素としては主に二つあり、一つ目は、HDR化処理であり、二つ目は、高解像度化処理である。
HDR化処理として、露光時間の異なる露光画像を用いたHDR化処理は、近年においては一般的な処理であるので、ここでは簡単に説明する。
HDR化処理として、露光時間の異なる露光画像を用いたHDR化処理は、近年においては一般的な処理であるので、ここでは簡単に説明する。
HDR化処理の基本的な考え方としては、画面内の低輝度領域は長露光画像(本実施形態における低解像度画像LR)のブレンド率が高くなるように画像を合成し、高輝度領域は短露光画像(本実施形態における高解像度画像HRA)のブレンド率が高くなるように画像を合成する。
これによりあたかもダイナミックレンジが広いカメラで撮影したような画像を生成することができ、白とびや黒潰れ等の没入感を阻害する要素を抑制することが可能である。
これによりあたかもダイナミックレンジが広いカメラで撮影したような画像を生成することができ、白とびや黒潰れ等の没入感を阻害する要素を抑制することが可能である。
以下、具体的にHDR化処理S15Aについて説明する。
まず拡大低解像度画像ELR及び高解像度画像HRAに対し、レンジ合わせ及びビット拡張を行う(ステップS23、S24)。これは、輝度範囲を一致させるとともに、ダイナミックレンジの拡大に伴う帯域確保を行うためである。
まず拡大低解像度画像ELR及び高解像度画像HRAに対し、レンジ合わせ及びビット拡張を行う(ステップS23、S24)。これは、輝度範囲を一致させるとともに、ダイナミックレンジの拡大に伴う帯域確保を行うためである。
続いて、拡大低解像度画像ELR及び高解像度画像HRAのそれぞれに対し、画素単位の輝度分布を表すαマップを生成する(ステップS25)。
そして、生成したαマップに対応する輝度分布に基づいて、拡大低解像度画像ELR及び高解像度画像HRAを合成するαブレンドを行う(ステップS26)。
そして、生成したαマップに対応する輝度分布に基づいて、拡大低解像度画像ELR及び高解像度画像HRAを合成するαブレンドを行う(ステップS26)。
より詳細には、低輝度領域は、生成したαマップに基づいて、長露光画像である拡大低解像度画像ELRのブレンド率が短露光画像である高解像度画像HRAのブレンド率よりも高くなるように画像を画素単位で合成する。
同様に、高輝度領域は、生成したαマップに基づいて、短露光画像である高解像度画像HRAのブレンド率が長露光画像である拡大低解像度画像ELRのブレンド率よりも高くなるように画像を画素単位で合成する。
続いて合成後の画像は、階調変化が急激となっている部分が存在するので、自然な階調変化となる、すなわち、階調変化がなだらかになるように階調補正を行う(ステップS27)。
以上の説明においては、実効的に第1画像である低解像度画像LR及び第2画像である高解像度画像HR1~HR3に双方に対し、HDR化処理を施していたが、合成画像の生成に際し、第1画像である低解像度画像LR及び第2画像である高解像度画像HR1~HR3のうちの少なくとも一方にHDR化処理を施すようにしてもよい。
以上の説明においては、実効的に第1画像である低解像度画像LR及び第2画像である高解像度画像HR1~HR3に双方に対し、HDR化処理を施していたが、合成画像の生成に際し、第1画像である低解像度画像LR及び第2画像である高解像度画像HR1~HR3のうちの少なくとも一方にHDR化処理を施すようにしてもよい。
一方、高解像度化処理ステップS15Bについては、本実施形態では、露光時間を長く設定した低解像度画像及び露光時間を短く設定した高解像度画像について、被写体の周波数領域に応じてお互いの良いところを組み合わせることにより行っている。
より詳細には拡大低解像度画像ELRは、長時間露光を行っておりSN比が高いので、低周波領域に多く使われるようにし、高解像度画像HRAは高精細なテクスチャが残っているので高周波領域に多く使われるようにする。このため、高解像度画像HRAに対し、ハイパスフィルタで周波数分離し(ステップS28)、高周波成分を分離した高解像度画像HRAの高周波成分をαブレンド後の画像に加算することで(ステップS29)、高解像度化処理を施し、さらに解像度変換処理を行って表示用画像DGを生成し(ステップS16)、ディスプレイ25にリアルタイムで出力する(ステップS17)。
ここで、リアルタイムで出力するとは、ユーザの動きに追従して、ユーザが違和感を感じることなく表示がなされるように出力するということである。
ここで、リアルタイムで出力するとは、ユーザの動きに追従して、ユーザが違和感を感じることなく表示がなされるように出力するということである。
以上の説明のように、本実施形態によれば、ユーザの動きによるモーションブラー及び高解像度化による転送画像データレートの情報を抑制しつつ、外部カメラ(本実施形態におけるVSTカメラ23の実効的なダイナミックレンジを現実の視野におけるダイナミックレンジと遜色ないようにすることができる。
ここで、低解像度画像及び高解像度画像の撮影順序と得られる効果について説明する。
図9は、上記実施形態における低解像度画像及び高解像度画像の撮影順序の説明図である。
上記実施形態においては、低解像度画像LRの撮影を最初に行い、その後、3枚の高解像度画像HR1~HR3の撮影を行っていた。
図9は、上記実施形態における低解像度画像及び高解像度画像の撮影順序の説明図である。
上記実施形態においては、低解像度画像LRの撮影を最初に行い、その後、3枚の高解像度画像HR1~HR3の撮影を行っていた。
したがって、撮影対象の概要的な内容を含み、動き補償等の画像合成時の撮影タイミングの基準となる低解像度画像LRの撮影後に合成される高解像度画像HR1~HR3の撮影を行うこととなる。
この結果、高解像度画像HR1~HR3の露光条件を、低解像度画像LRの露光条件に合わせて調整しやすくなり、合成後により違和感の少ない合成画像を得ることができる。
この結果、高解像度画像HR1~HR3の露光条件を、低解像度画像LRの露光条件に合わせて調整しやすくなり、合成後により違和感の少ない合成画像を得ることができる。
図10は、他の低解像度画像及び高解像度画像の撮影順序の説明図である。
上記実施形態において、高解像度画像HR1~HR3の撮影は、低解像度画像LRの撮影後に全て行われていたが、図10の例では、高解像度画像HR1の撮影後に、低解像度画像LRを撮影し、さらにその後に高解像度画像HR2及び高解像度画像HR3の撮影を行っている。
上記実施形態において、高解像度画像HR1~HR3の撮影は、低解像度画像LRの撮影後に全て行われていたが、図10の例では、高解像度画像HR1の撮影後に、低解像度画像LRを撮影し、さらにその後に高解像度画像HR2及び高解像度画像HR3の撮影を行っている。
この結果、画像合成の基本となる低解像度画像LRの撮影タイミングに対する高解像度画像HR1~HR3の撮影タイミングの時間差が少なくなり、ひいては、動き補償を行う際の時間的な距離(及び被写体の移動距離)が短くなるので、動き補償の精度が向上した合成画像を得ることが可能となる。
また、上記撮影順に代えて、高解像度画像HR1及び高解像度画像HR2の撮影後に、低解像度画像LRを撮影し、さらにその後に高解像度画像HR3の撮影を行うようにしても同様の効果が得られる。
すなわち、第2画像であるHR1~HR3の撮像が第1画像である低解像度画像LRの撮像の前後それぞれでなされるようにイメージセンサを制御するようにしても同様の効果が得られる。
より詳細には、高解像度画像を複数枚撮影する場合に、低解像度画像LRの撮影タイミングの前に撮影する高解像度画像の撮影枚数と、低解像度画像LRの撮影タイミングの後に撮影する高解像度画像の撮影枚数と、の差がより少なくなるようにすれば(より好ましくは同数)、同様の効果が得られる。
より詳細には、高解像度画像を複数枚撮影する場合に、低解像度画像LRの撮影タイミングの前に撮影する高解像度画像の撮影枚数と、低解像度画像LRの撮影タイミングの後に撮影する高解像度画像の撮影枚数と、の差がより少なくなるようにすれば(より好ましくは同数)、同様の効果が得られる。
図11は、さらに他の低解像度画像及び高解像度画像の撮影順序の説明図である。
上記実施形態において、高解像度画像HR1~HR3の撮影は、低解像度画像LRの撮影後に全て行われていたが、図11の例では、逆に高解像度画像HR1~HR3の撮影後に、低解像度画像LRの撮影を行っている。
この結果、画像合成の基本となる低解像度画像LRの実際の被写体の動きに対するレイテンシ(遅延時間)を最も小さくすることができ、合成画像による表示画像と実際の被写体の動きとのずれが最も少ない自然が画像を表示することができる。
上記実施形態において、高解像度画像HR1~HR3の撮影は、低解像度画像LRの撮影後に全て行われていたが、図11の例では、逆に高解像度画像HR1~HR3の撮影後に、低解像度画像LRの撮影を行っている。
この結果、画像合成の基本となる低解像度画像LRの実際の被写体の動きに対するレイテンシ(遅延時間)を最も小さくすることができ、合成画像による表示画像と実際の被写体の動きとのずれが最も少ない自然が画像を表示することができる。
[6]実施形態の変形例
なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
以上の説明においては、1枚の低解像度画像LRに対して、3枚の高解像度画像HR1~HR3を撮像して、合成する構成を採っていたが、1枚の低解像度画像LRに対して、1枚あるいは、4枚以上の低解像度画像を撮像して合成するようにしても同様の効果を得ることが可能である。
さらに、本技術は、以下の構成とすることも可能である。
(1)
イメージセンサから入力された、第1露光時間で撮像されて第1解像度を有する第1画像と、前記第1画像の一部の領域に相当する画像であって、前記第1露光時間よりも短い第2露光時間で撮像されて前記第1解像度よりも高い第2解像度を有する第2画像とを合成した合成画像を生成し、前記合成画像を表示装置に出力する制御部を備えた
画像処理装置。
(2)
前記合成画像の生成に際し、前記第1画像及び前記第2画像のうちの少なくとも一方にHDR化処理を施す
(1)記載の画像処理装置。
(3)
前記制御部は、前記第1画像の撮像タイミングを基準とする動き補償を前記第2画像に対して施す、
(1)又は(2)記載の画像処理装置。
(4)
前記制御部は、一の前記第1画像に対応する複数の前記第2画像が入力され、前記第1画像と複数の前記第2画像を合成した合成画像を生成する、
(1)乃至(3)のいずれか一つに記載の画像処理装置。
(5)
前記制御部は、前記第1画像の撮像が前記第2画像の撮像に先だってなされるように前記イメージセンサを制御する、
(1)乃至(4)のいずれか一つに記載の画像処理装置。
(6)
前記制御部は、前記第2画像の撮像が前記第1画像の撮像に先だってなされるように前記イメージセンサを制御する、
(1)乃至(4)のいずれか一つに記載の画像処理装置。
(7)
前記制御部は、前記第2画像の撮像が前記第1画像の撮像の前後それぞれでなされるように前記イメージセンサを制御する、
(4)記載の画像処理装置。
(8)
前記制御部は、前記第1画像の解像度が前記第2解像度となるように拡大処理を行い、
複数の前記第2画像の加算平均を行った後に、前記合成画像を生成する、
(2)記載の画像処理装置。
(9)
前記領域は、所定の注目領域あるいはユーザの視線方向に基づく注目領域とされる、
(1)乃至(8)のいずれか一つに記載の画像処理装置。
(10)
前記制御部は、前記合成画像の生成及び前記表示装置への出力をリアルタイムで行う、
(1)乃至(9)のいずれか一つに記載の画像処理装置。
(11)
イメージセンサを有し、第1露光時間で撮像され第1解像度を有する第1画像及び前記第1画像の一部の領域に相当する画像であって、前記第1露光時間よりも短い第2露光時間で撮像され、前記第1解像度よりも高い第2解像度を有する第2画像を出力する撮像装置と、
前記第1画像と、前記第2画像とを合成した合成画像を生成して出力する制御部を備えた画像処理装置と、
入力された前記合成画像を表示する表示装置と、
を備えた画像表示システム。
(12)
前記撮像装置は、ユーザに装着され、
前記画像表示システムは、前記ユーザの視線方向を検出する視線方向検出装置を備え、
前記領域は、前記視線方向に基づいて設定される、
(11)記載の画像表示システム。
(13)
イメージセンサの制御を行う画像処理装置で実行される方法であって、
第1露光時間で撮像されて第1解像度を有する第1画像と、第1画像の一部の領域に相当する画像であって、第1露光時間よりも短い第2露光時間で撮像されて第1解像度よりも高い第2解像度を有する第2画像が前記イメージセンサから入力される過程と、
前記第1画像と前記第2画像を合成した合成画像を生成する過程と、
を備えた方法。
(14)
イメージセンサの制御を行う画像処理装置をコンピュータにより制御するためのプログラムであって、
前記コンピュータを、
第1露光時間で撮像されて第1解像度を有する第1画像と、第1画像の一部の領域に相当する画像であって、第1露光時間よりも短い第2露光時間で撮像されて第1解像度よりも高い第2解像度を有する第2画像が前記イメージセンサから入力される手段と、
前記第1画像と前記第2画像を合成した合成画像を生成する手段と、
して機能させるプログラム。
(1)
イメージセンサから入力された、第1露光時間で撮像されて第1解像度を有する第1画像と、前記第1画像の一部の領域に相当する画像であって、前記第1露光時間よりも短い第2露光時間で撮像されて前記第1解像度よりも高い第2解像度を有する第2画像とを合成した合成画像を生成し、前記合成画像を表示装置に出力する制御部を備えた
画像処理装置。
(2)
前記合成画像の生成に際し、前記第1画像及び前記第2画像のうちの少なくとも一方にHDR化処理を施す
(1)記載の画像処理装置。
(3)
前記制御部は、前記第1画像の撮像タイミングを基準とする動き補償を前記第2画像に対して施す、
(1)又は(2)記載の画像処理装置。
(4)
前記制御部は、一の前記第1画像に対応する複数の前記第2画像が入力され、前記第1画像と複数の前記第2画像を合成した合成画像を生成する、
(1)乃至(3)のいずれか一つに記載の画像処理装置。
(5)
前記制御部は、前記第1画像の撮像が前記第2画像の撮像に先だってなされるように前記イメージセンサを制御する、
(1)乃至(4)のいずれか一つに記載の画像処理装置。
(6)
前記制御部は、前記第2画像の撮像が前記第1画像の撮像に先だってなされるように前記イメージセンサを制御する、
(1)乃至(4)のいずれか一つに記載の画像処理装置。
(7)
前記制御部は、前記第2画像の撮像が前記第1画像の撮像の前後それぞれでなされるように前記イメージセンサを制御する、
(4)記載の画像処理装置。
(8)
前記制御部は、前記第1画像の解像度が前記第2解像度となるように拡大処理を行い、
複数の前記第2画像の加算平均を行った後に、前記合成画像を生成する、
(2)記載の画像処理装置。
(9)
前記領域は、所定の注目領域あるいはユーザの視線方向に基づく注目領域とされる、
(1)乃至(8)のいずれか一つに記載の画像処理装置。
(10)
前記制御部は、前記合成画像の生成及び前記表示装置への出力をリアルタイムで行う、
(1)乃至(9)のいずれか一つに記載の画像処理装置。
(11)
イメージセンサを有し、第1露光時間で撮像され第1解像度を有する第1画像及び前記第1画像の一部の領域に相当する画像であって、前記第1露光時間よりも短い第2露光時間で撮像され、前記第1解像度よりも高い第2解像度を有する第2画像を出力する撮像装置と、
前記第1画像と、前記第2画像とを合成した合成画像を生成して出力する制御部を備えた画像処理装置と、
入力された前記合成画像を表示する表示装置と、
を備えた画像表示システム。
(12)
前記撮像装置は、ユーザに装着され、
前記画像表示システムは、前記ユーザの視線方向を検出する視線方向検出装置を備え、
前記領域は、前記視線方向に基づいて設定される、
(11)記載の画像表示システム。
(13)
イメージセンサの制御を行う画像処理装置で実行される方法であって、
第1露光時間で撮像されて第1解像度を有する第1画像と、第1画像の一部の領域に相当する画像であって、第1露光時間よりも短い第2露光時間で撮像されて第1解像度よりも高い第2解像度を有する第2画像が前記イメージセンサから入力される過程と、
前記第1画像と前記第2画像を合成した合成画像を生成する過程と、
を備えた方法。
(14)
イメージセンサの制御を行う画像処理装置をコンピュータにより制御するためのプログラムであって、
前記コンピュータを、
第1露光時間で撮像されて第1解像度を有する第1画像と、第1画像の一部の領域に相当する画像であって、第1露光時間よりも短い第2露光時間で撮像されて第1解像度よりも高い第2解像度を有する第2画像が前記イメージセンサから入力される手段と、
前記第1画像と前記第2画像を合成した合成画像を生成する手段と、
して機能させるプログラム。
10 VRヘッドマウントディスプレイシステム(画像表示システム)
11 ヘッドマウントディスプレイ(HMD部)
12 情報処理装置(PC部)
21 IMU
22 SLAM用カメラ
23 VSTカメラ
23A イメージセンサ
24 アイトラッキングカメラ
25 ディスプレイ
31 自己位置推定部
32 注目領域決定部
33 ISP
34 補償部
35 フレームメモリ
36 画像合成部
AR 領域
ARF 最高解像度領域
CAR 中心視野領域
DG 表示用画像
ELR 拡大低解像度画像
HR1~HR3、HRA 高解像度画像
LDA 左目画像
LR 低解像度画像
PAR 周辺視野領域
RDA 右目画像
SAR 有効視野領域
11 ヘッドマウントディスプレイ(HMD部)
12 情報処理装置(PC部)
21 IMU
22 SLAM用カメラ
23 VSTカメラ
23A イメージセンサ
24 アイトラッキングカメラ
25 ディスプレイ
31 自己位置推定部
32 注目領域決定部
33 ISP
34 補償部
35 フレームメモリ
36 画像合成部
AR 領域
ARF 最高解像度領域
CAR 中心視野領域
DG 表示用画像
ELR 拡大低解像度画像
HR1~HR3、HRA 高解像度画像
LDA 左目画像
LR 低解像度画像
PAR 周辺視野領域
RDA 右目画像
SAR 有効視野領域
Claims (14)
- イメージセンサから入力された、第1露光時間で撮像されて第1解像度を有する第1画像と、前記第1画像の一部の領域に相当する画像であって、前記第1露光時間よりも短い第2露光時間で撮像されて前記第1解像度よりも高い第2解像度を有する第2画像とを合成した合成画像を生成し、前記合成画像を表示装置に出力する制御部を備えた、
画像処理装置。 - 前記制御部は、前記合成画像の生成に際し、前記第1画像及び前記第2画像のうちの少なくとも一方にHDR化処理を施す、
請求項1に記載の画像処理装置。 - 前記制御部は、前記第1画像の撮像タイミングを基準とする動き補償を前記第2画像に対して施す、
請求項1に記載の画像処理装置。 - 前記制御部は、一の前記第1画像に対応する複数の前記第2画像が入力され、前記第1画像と複数の前記第2画像を合成した合成画像を生成する、
請求項1に記載の画像処理装置。 - 前記制御部は、前記第1画像の撮像が前記第2画像の撮像に先だってなされるように前記イメージセンサを制御する、
請求項1に記載の画像処理装置。 - 前記制御部は、前記第2画像の撮像が前記第1画像の撮像に先だってなされるように前記イメージセンサを制御する、
請求項1に記載の画像処理装置。 - 前記制御部は、前記第2画像の撮像が前記第1画像の撮像の前後それぞれでなされるように前記イメージセンサを制御する、
請求項4に記載の画像処理装置。 - 前記制御部は、前記第1画像の解像度が前記第2解像度となるように拡大処理を行い、
複数の前記第2画像の加算平均を行った後に、前記合成画像を生成する、
請求項2に記載の画像処理装置。 - 前記領域は、所定の注目領域あるいはユーザの視線方向に基づく注目領域とされる、
請求項1に記載の画像処理装置。 - 前記制御部は、前記合成画像の生成及び前記表示装置への出力をリアルタイムで行う、
請求項1に記載の画像処理装置。 - イメージセンサを有し、第1露光時間で撮像され第1解像度を有する第1画像及び前記第1画像の一部の領域に相当する画像であって、前記第1露光時間よりも短い第2露光時間で撮像され、前記第1解像度よりも高い第2解像度を有する第2画像を出力する撮像装置と、
前記第1画像と、前記第2画像とを合成した合成画像を生成して出力する制御部を備えた画像処理装置と、
入力された前記合成画像を表示する表示装置と、
を備えた画像表示システム。 - 前記撮像装置は、ユーザに装着され、
前記画像表示システムは、前記ユーザの視線方向を検出する視線方向検出装置を備え、
前記領域は、前記視線方向に基づいて設定される、
請求項11に記載の画像表示システム。 - イメージセンサの制御を行う画像処理装置で実行される方法であって、
イメージセンサから入力された、第1露光時間で撮像されて第1解像度を有する第1画像と、第1画像の一部の領域に相当する画像であって、第1露光時間よりも短い第2露光時間で撮像されて第1解像度よりも高い第2解像度を有する第2画像が前記イメージセンサから入力される過程と、
前記第1画像と前記第2画像を合成した合成画像を生成する過程と、
を備えた方法。 - イメージセンサの制御を行う画像処理装置をコンピュータにより制御するためのプログラムであって、
前記コンピュータを、
第1露光時間で撮像されて第1解像度を有する第1画像と、第1画像の一部の領域に相当する画像であって、第1露光時間よりも短い第2露光時間で撮像されて第1解像度よりも高い第2解像度を有する第2画像が前記イメージセンサから入力される手段と、
前記第1画像と前記第2画像を合成した合成画像を生成する手段と、
して機能させるプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022531708A JPWO2021261248A1 (ja) | 2020-06-23 | 2021-06-09 | |
DE112021003347.6T DE112021003347T5 (de) | 2020-06-23 | 2021-06-09 | Bildverarbeitungsvorrichtung, bildanzeigesystem, -verfahren und -programm |
US18/002,034 US20230232103A1 (en) | 2020-06-23 | 2021-06-09 | Image processing device, image display system, method, and program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020107901 | 2020-06-23 | ||
JP2020-107901 | 2020-06-23 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2021261248A1 true WO2021261248A1 (ja) | 2021-12-30 |
Family
ID=79282572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2021/021875 WO2021261248A1 (ja) | 2020-06-23 | 2021-06-09 | 画像処理装置、画像表示システム、方法及びプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230232103A1 (ja) |
JP (1) | JPWO2021261248A1 (ja) |
DE (1) | DE112021003347T5 (ja) |
WO (1) | WO2021261248A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024043438A1 (ko) * | 2022-08-24 | 2024-02-29 | 삼성전자주식회사 | 카메라 모듈을 제어하는 웨어러블 전자 장치 및 그 동작 방법 |
WO2024196600A1 (en) * | 2023-03-20 | 2024-09-26 | Qualcomm Incorporated | Generating a composite image based on regions of interest |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220383512A1 (en) * | 2021-05-27 | 2022-12-01 | Varjo Technologies Oy | Tracking method for image generation, a computer program product and a computer system |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008277896A (ja) * | 2007-04-25 | 2008-11-13 | Kyocera Corp | 撮像装置および撮像方法 |
JP2014230170A (ja) * | 2013-05-23 | 2014-12-08 | オリンパス株式会社 | 撮像装置、顕微鏡システム及び撮像方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5511205B2 (ja) | 1973-03-01 | 1980-03-24 | ||
JP4334950B2 (ja) | 2003-09-04 | 2009-09-30 | オリンパス株式会社 | 固体撮像装置 |
KR101643319B1 (ko) * | 2010-01-11 | 2016-07-27 | 삼성전자주식회사 | 하이 다이나믹 레인지 영상을 획득하는 장치 및 그 방법 |
JP2011254125A (ja) * | 2010-05-31 | 2011-12-15 | Sony Corp | 画像処理装置、カメラシステム、画像処理方法、およびプログラム |
US8665342B2 (en) * | 2011-03-03 | 2014-03-04 | King Abddulaziz City For Science And Technology | Model-independent generation of an enhanced resolution image from a number of low resolution images |
JP5906023B2 (ja) * | 2011-04-28 | 2016-04-20 | キヤノン株式会社 | 撮像装置及びその制御方法 |
CN109040552B (zh) * | 2013-06-13 | 2021-06-22 | 核心光电有限公司 | 双孔径变焦数字摄影机 |
JP6391383B2 (ja) * | 2014-02-10 | 2018-09-19 | キヤノン株式会社 | 画像処理装置、その制御方法、プログラム及び記憶媒体 |
JP6453694B2 (ja) * | 2015-03-31 | 2019-01-16 | 株式会社モルフォ | 画像合成装置、画像合成方法、画像合成プログラム及び記録媒体 |
JP2017069927A (ja) * | 2015-10-02 | 2017-04-06 | ソニー株式会社 | 画像処理装置、および画像処理方法、並びにプログラム |
JP6870080B2 (ja) * | 2017-05-18 | 2021-05-12 | 株式会社ソニー・インタラクティブエンタテインメント | 画像生成装置、画像表示システム、および画像生成方法 |
KR102318013B1 (ko) * | 2017-10-13 | 2021-10-27 | 삼성전자 주식회사 | 복수의 이미지들을 합성하는 전자장치 및 방법 |
JP2021039444A (ja) * | 2019-08-30 | 2021-03-11 | キヤノン株式会社 | 画像処理装置及びその制御方法及びプログラム |
US11792531B2 (en) * | 2019-09-27 | 2023-10-17 | Apple Inc. | Gaze-based exposure |
-
2021
- 2021-06-09 JP JP2022531708A patent/JPWO2021261248A1/ja active Pending
- 2021-06-09 DE DE112021003347.6T patent/DE112021003347T5/de active Pending
- 2021-06-09 WO PCT/JP2021/021875 patent/WO2021261248A1/ja active Application Filing
- 2021-06-09 US US18/002,034 patent/US20230232103A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008277896A (ja) * | 2007-04-25 | 2008-11-13 | Kyocera Corp | 撮像装置および撮像方法 |
JP2014230170A (ja) * | 2013-05-23 | 2014-12-08 | オリンパス株式会社 | 撮像装置、顕微鏡システム及び撮像方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024043438A1 (ko) * | 2022-08-24 | 2024-02-29 | 삼성전자주식회사 | 카메라 모듈을 제어하는 웨어러블 전자 장치 및 그 동작 방법 |
WO2024196600A1 (en) * | 2023-03-20 | 2024-09-26 | Qualcomm Incorporated | Generating a composite image based on regions of interest |
Also Published As
Publication number | Publication date |
---|---|
US20230232103A1 (en) | 2023-07-20 |
JPWO2021261248A1 (ja) | 2021-12-30 |
DE112021003347T5 (de) | 2023-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102502404B1 (ko) | 정보 처리 장치 및 방법, 그리고 프로그램 | |
WO2021261248A1 (ja) | 画像処理装置、画像表示システム、方法及びプログラム | |
US11024082B2 (en) | Pass-through display of captured imagery | |
JPWO2019171522A1 (ja) | ヘッドマウントディスプレイ、注視点検出器、および画素データ読み出し方法 | |
US7940295B2 (en) | Image display apparatus and control method thereof | |
US10997741B2 (en) | Scene camera retargeting | |
JP6768933B2 (ja) | 情報処理装置、情報処理システム、および画像処理方法 | |
WO2022014271A1 (ja) | 画像処理装置、画像表示システム、方法及びプログラム | |
US10373293B2 (en) | Image processing apparatus, image processing method, and storage medium | |
US20200310126A1 (en) | Image processing method, image processing apparatus, and head-mounted display | |
JP5393877B2 (ja) | 撮像装置および集積回路 | |
US9571720B2 (en) | Image processing device, display device, imaging apparatus, image processing method, and program | |
WO2019073925A1 (ja) | 画像生成装置および画像生成方法 | |
JP2012080411A (ja) | 撮像装置及びその制御方法 | |
WO2018084051A1 (ja) | 情報処理装置、ヘッドマウントディスプレイ、情報処理システム、および情報処理方法 | |
JP2008060981A (ja) | 画像観察装置 | |
US10616504B2 (en) | Information processing device, image display device, image display system, and information processing method | |
US12096128B2 (en) | Image processing apparatus, information processing system, and image acquisition method | |
WO2023062996A1 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP6930011B2 (ja) | 情報処理装置、情報処理システム、および画像処理方法 | |
US11263999B2 (en) | Image processing device and control method therefor | |
US20240370978A1 (en) | Image processing apparatus that combines captured image and cg image, image processing method, and storage medium | |
JP6622537B2 (ja) | 画像処理装置、画像処理システム、及び画像処理方法 | |
JP2018085691A (ja) | 画像処理装置及びその制御方法、プログラム、記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21830051 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2022531708 Country of ref document: JP Kind code of ref document: A |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 21830051 Country of ref document: EP Kind code of ref document: A1 |