Toshiba Corporation heeft een AI met 3D-herkenning ontwikkeld die afstand kan meten met de nauwkeurigheid van een stereocamera, door gebruik te maken van de afbeelding die is gemaakt met een commerciële camera en door de beeldvervaging veroorzaakt door de cameralens te analyseren met behulp van deep learning. Deze technologie maakt het gebruik van stereocamera's overbodig, wat uiteindelijk de kosten en ruimte vermindert. Toshiba presenteert deze prestatie op de internationale conferentie over computervisie (ICCV2019) die op 30 oktober 2019 vanaf 10.00 uur in Zuid-Korea wordt gehouden.
Beelddetectie wordt steeds belangrijker en toepassingen zoals robots die objecten verplaatsen, autonome onbemande voertuigen, op afstand bestuurbare drones die infrastructuur inspecteren, enz., Vereisen meer dan alleen afbeeldingen van de onderwerpen, ze hebben een klein apparaat nodig om 3D-gegevens te analyseren om vorm en afstand te omvatten. Vandaar dat het onderzoek is uitgebreid om een meettechnologie te ontwikkelen met monoculaire camera's (ze zijn gemakkelijk te miniaturiseren) door gebruik te maken van diep leren voor een beter leren van de vorm, achtergrond en andere landschapsgegevens van het afgebeelde object.
Deze methode heeft een nadeel; De nauwkeurigheid van de afstand wordt geschat met behulp van een monoculaire camera, afhankelijk van aangeleerde landschapsgegevens, waardoor de nauwkeurigheid afneemt als gevolg van de opnamen die in verschillende landschappen zijn gemaakt. Om dit te ondervangen heeft Toshiba fotografie met kleurgefilterde diafragmaopeningen ontwikkeld waarbij een tweekleurenfilter op de lens is bevestigd en de kleur en grootte van de resulterende beeldvervaging worden geanalyseerd op basis van de afstand tot het onderwerp. Hoewel dit het probleem van gegevensafhankelijkheid oplost, kost het tijd en geld om bestaande lenzen aan te passen.
Toshiba heeft dit probleem overwonnen door AI te ontwikkelen met 3D-herkenningstechnologie die deep learning gebruikt om te analyseren hoe het beeld wazig is op basis van de positie op de lens, om afstandsmeting te bereiken met dezelfde hoge precisie als een stereocamerasysteem., met een normale monoculaire camera maar zonder enige behoefte aan landschapsgegevens. Tot nu toe werd het theoretisch onmogelijk geacht om de afstand te meten op basis van de vorm van de onscherpte, wat hetzelfde is voor objecten met zowel afstand als ver wanneer ze op gelijke afstand van het brandpunt staan. Maar de analytische resultaten hebben een substantieel verschil aangetoond tussen de vervagingsvormen dichtbij en verre objecten, zelfs als ze op gelijke afstand van het brandpunt staan. Daarmee analyseerde Toshiba met succes wazige gegevens van vastgelegde afbeeldingen door een deep learning-module die getraind is met het deep neurale netwerkmodel.
Wanneer het licht door de lens gaat, verandert de vorm van de vervaging die wordt veroorzaakt, afhankelijk van de golflengte van het licht en zijn positie in de lens. In het ontwikkelde netwerk worden positie en kleur afzonderlijk verwerkt om veranderingen in de wazige vorm goed waar te nemen, en vervolgens, na door een gewogen aandachtsmechanisme te zijn gegaan, om te bepalen waar op de helderheidsgradiënt moet worden scherpgesteld om de afstand correct te meten. Door middel van leren wordt het netwerk vervolgens bijgewerkt om een fout tussen de gemeten afstand en de werkelijke afstand te verminderen. Met behulp van deze AI-module heeft Toshiba bevestigd dat een enkele afbeelding die is vastgelegd met een in de handel verkrijgbare camera dezelfde nauwkeurigheid van afstandsmeting realiseert als met stereocamera's. Meer informatie is te vinden op deze officiële pagina van Toshiba.
Toshiba zal de veelzijdigheid van het systeem met in de handel verkrijgbare camera's en lenzen bevestigen en de beeldverwerking versnellen, met het oog op publieke implementatie in het fiscale jaar 2020.