
En un estudi recent, investigadors de la Xina han desenvolupat un sistema LiDAR a escala de xip-que imita la visió de l'ull humà concentrant de manera dinàmica la detecció d'alta-resolució a les regions d'interès (ROI) alhora que manté una àmplia consciència en tot el camp de visió.
L'estudi es publica a la revistaComunicacions de la natura.
Els sistemes LiDAR alimenten la visió artificial en cotxes, drons i robots que es condueixen autònomament- disparant raigs làser per mapejar escenes en 3D amb precisió mil·limètrica. L'ull empaqueta els seus sensors més densos a la fòvea (punt de visió central nítida) i desplaça la mirada cap al que és important. Per contra, la majoria de LiDAR utilitzen feixos paral·lels rígids o escanejos que difonen una resolució uniforme (sovint gruixuda) per tot arreu. Augmentar el detall significa afegir més canals de manera uniforme, cosa que augmenta els costos, la potència i la complexitat.
El disseny de l'equip aconsegueix una resolució angular "més enllà de la-retina" de 0,012 graus en ROI-el doble de nítida que el límit aproximat de 0,017 graus de l'ull. Això significa que el sistema pot distingir punts separats pels angles més petits, com ara escollir detalls en un senyal de trànsit llunyà. Reassigna canals de detecció paral·lels sota demanda, evitant l'escalat de força bruta-costosa.
Phys.org va parlar amb els co-autors de l'estudi, Ruixuan Chen i Xingjun Wang, de l'Escola d'Electrònica de la Universitat de Pequín.
"La motivació prové d'un desajust pràctic entre la percepció biològica i la de la màquina", van explicar els investigadors. "L'ull humà aconsegueix una gran agudesa i eficiència energètica reassignant l'atenció-mantenint una àmplia consciència alhora que concentra els recursos en allò que importa. Per contra, la resolució LiDAR sovint es persegueix per "més canals a tot arreu", que ràpidament esdevé car i consumeix energia-".
El problema de l'escala
Els sistemes de visió artificial s'han expandit més enllà de les càmeres tradicionals per incloure sensors LiDAR, que permeten la mesura precisa de la distància i la percepció ambiental en 3D. A diferència de les càmeres passives, però, el LiDAR exigeix maquinari d'emissió i recepció per a cada píxel, limitant la resolució assolible.
Els enfocaments actuals per millorar la resolució LiDAR s'enfronten a un coll d'ampolla crític. La duplicació de canals ofereix guanys de resolució lineal, però provoca explosions superlineals de complexitat, potència i cost.
"En primer lloc, la resolució està estretament vinculada al recompte de canals de maquinari i a la mecànica d'escaneig. En segon lloc, el LiDAR és un sensor actiu: cada píxel costa efectivament tant els recursos de transmissió com de recepció", van explicar els investigadors. "Això fa que l'enfocament adaptatiu sigui fonamentalment més difícil que en la imatge passiva, perquè heu de gestionar la potència òptica, la sensibilitat del receptor i l'amplada de banda de digitalització alhora que compliu amb les restriccions de seguretat-oculars".
Per al LiDAR d'ona contínua modulada de freqüència coherent-, aquest repte és particularment agut. Cada canal coherent requereix un control de freqüència estable, un maquinari de recepció sofisticat i una calibració estricta. Això fa que la duplicació massiva de canals sigui molt més difícil de justificar econòmicament.
Una solució biomimètica
La solució dels investigadors combina dues tecnologies clau. Aquests inclouen un làser de cavitat-externa (ECL) àgil amb un rang de sintonització de més de 100 nm i pintes de freqüència electro-òptica reconfigurables construïdes sobre plataformes de niòbat de liti de-pel·lícula fina (TFLN).
L'ECL proporciona senyals de xip FMCW d'alta-qualitat per a un rang coherent i actua com un mecanisme de direcció del feix-controlat de longitud d'ona-. En ajustar la longitud d'ona central, el sistema pot redirigir ràpidament la seva direcció de visió dins d'un ampli camp de visió.
Aleshores, la pinta electro-òptica genera diversos portadors FMCW paral·lels a partir de la mateixa font làser de xip. De manera crucial, ajustar les condicions de la unitat de radiofreqüència canvia l'espaiat del pentinat.
"Això és el que permet fer 'zoom'-podem augmentar la densitat de punts en una regió seleccionada (mostreig més fi) o relaxar-la (mostreig més gruixut) sense canviar l'òptica ni afegir canals", van afegir els investigadors.
El sistema utilitza el que els investigadors anomenen "micro-paral·lelisme". Això significa utilitzar un nombre moderat de canals físics per aconseguir l'equivalent a moltes més línies d'escaneig mitjançant el reposicionament dinàmic.
Validació experimental
L'equip va demostrar les capacitats del sistema en tres escenaris experimentals, aconseguint una resolució angular de 0,012 graus en regions focalitzades-superant el límit nominal de la retina humana.
En imatges d'escenes estàtiques, el sistema va capturar un entorn de carretera simulat amb resolucions de 54 per 71 píxels per a exploracions de camp complet-de-visió i 17 per 71 píxels per a exploracions enfocades localment. Aquestes exploracions enfocades van quadruplicar la densitat de detall vertical, revelant obstacles abans invisibles, amb un 90% dels punts precisos a menys d'1,3 cm.
Els investigadors també van demostrar la fusió de càmeres LiDAR-, creant núvols de punts acolorits que combinen geometria 3D precisa amb dades d'aspecte RGB. Quan es comparen les exploracions estàndard amb les enfocades, l'alineació de l'histograma de color va millorar aproximadament un 10%, cosa que indica una millor correspondència entre els punts 3D i els píxels de la imatge.
"En fusionar LiDAR amb una càmera, generem núvols de punts acolorits i enriquim la representació de l'escena, la qual cosa millora la interpretabilitat i admet tasques de percepció aigües avall que depenen de la textura i les indicacions semàntiques", van explicar els investigadors.
Potser el més impressionant és que l'equip va capturar-en temps real 4D-a més d'imatges-d'un llançament de bàsquet on cada punt mostrava la posició, la velocitat de gir, la reflectivitat de la superfície i el color simultàniament. A 8 Hz en un ampli camp de visió, això va revelar patrons de moviment invisibles per al LiDAR 3D estàndard.
El treball experimental va revelar importants intercanvis-a nivell de sistema que informen les futures rutes de desenvolupament.
"La més clara és la tensió entre la resolució angular i l'espai de mesura per-canal", van assenyalar els investigadors. "A la nostra lectura coherent paral·lela, cada canal ha d'ocupar la seva pròpia banda elèctrica no-superposada. Quan reduïm la freqüència de repetició, podem empènyer el mostreig angular més fins, però l'experiment mostra que això també comprimeix l'amplada de banda de lectura per-canal".
L'equip va identificar diverses direccions prioritàries per avançar la tecnologia cap al desplegament pràctic. Aquests inclouen una integració monolítica més profunda a les plataformes TFLN, el desenvolupament de fonts escombrades de banda ultra-ample per millorar la resolució d'interval i la implementació de polítiques d'atenció en bucle-tancat per a la percepció d'esdeveniments-.
Els experiments actuals que utilitzen enllaços de fibra introdueixen una inestabilitat de polarització que limita les capacitats de classificació de materials.
"No obstant això, preveiem que la integració monolítica resoldrà fonamentalment aquest coll d'ampolla", van dir els investigadors. "En passar de camins de fibra inestables a guies d'ones de-xip confinats, podem aconseguir una recuperació estable de la polarització".
El sistema LiDAR biònic ofereix aplicacions potencials que abasten vehicles autònoms, drons aeris i marins, robòtica i sistemes de visió neuromòrfica. Més enllà del LiDAR, les pintes reconfigurables permeten una anàlisi espectral ràpida per a comunicacions òptiques, tomografia de coherència, detecció compressiva i metrologia de precisió, segons els investigadors.









