Drono nusileidimo vietos nustatymas naudojant semantinę segmentaciją
Bakalauro darbas
Turinys
Santrauka 1
Summary 2
Įvadas 5
1 Semantinis segmentavimas 6
2 Kriterijai neuroninių tinklų architektūroms 7
3 Konvoliuciniai neuroniniai tinklai 8
3.1 Konvoliucija 8
3.2 Aktyvacijos funkcija 8
3.3 Sutraukimo sluoksniai 8
3.4 KNT privalumai semantinėje segmentacijoje 9
3.5 KNT trūkumai semantinėje segmentacijoje 9
4 Transformerių neuroniai tinklai 11
4.1 Savarankiško dėmesio mechanizmas 11
4.1.1 Savarankiško dėmesio skaičiavimas 11
4.2 Pozicijos užkodavimas 12
4.3 Transformerių privalumai semantiniame segmentavime 12
5 KNT ir transfomerių architektūrų palyginimas 14
6 Neuroninių tinklų architektūrų analizė 15
6.1 Deeplabv3 15
6.1.1 Išplėstoji konvoliucija 15
6.1.2 Plečiantysis erdvinis piramidės sutraukimas 16
6.1.3 Enkoderio, dekoderio struktūra 16
6.1.4 DeepLabv3+ 16
6.1.5 Rezultatai 17
6.2 SegFormer 17
6.2.1 Hierarchinis enkoderis 17
6.2.2 Efektyvus savipriežiūros mechanizmas 18
6.2.3 Daugiasluoksniu perceptronu remtas dekoderis 18
6.2.4 Rezultatai 19
7 Eksperimentas 20
7.1 Programinė įranga 20
7.2 Duomenų rinkinys 20
7.3 Duomenų apdorojimas 20
7.4 Metrikos 21
7.5 Modelių treniravimo rezultatai 22
7.5.1 Segformer MiT-b0 22
7.5.2 Segformer MiT-b2 23
7.5.3 Deeplabv3+ 24
7.6 Bandymas su kintančiu masteliu 25
8 Rezultatai ir išvados 29
Literatūra 31
Priedai 32
Įvadas
Dronas - bepilotis lėktuvas, skraidantis robotas, kuris gali būti valdomas nuotolinių būdų
arba skristi savarankiškai, naudojant iš anksto paruoštus skrydžio planus. Informacija išgauta
dronais - dažniausiai sensorinė, garsinė, geografinė arba vaizdinė (nuotraukos ir vaizdo įrašai).
Dronų naudojimas paplito ne tik tokiose akivaizdžiose srityse, kaip karyba [Ros18], tačiau vis
dažniau yra pradedami naudoti ir civilinių asmenų veiklose.
Šiame darbe bus nagrinėjami vaizdiniai duomenys, išgauti dronų pagalba - nuotraukos.
Naudojant dronais išgautų nuotraukų duomenų rinkinį bus atliktas nuotraukų analizės uždavinys,
kuris yra svarbus išgaunant svarbius duomenis, sprendžiant klimato atšilimo problemą, tiriant
gamtą, pavyzdžiui, nustatant medžių aukštį [Slb20], ar sprendžiant kitas problemas, kurioms
reikia dronų savieigiškumo ir lengvumo valdyti - nuotraukų semantinis segmentavimas.
Dronais išgautų nuotraukų segmentacija dažnai naudojama, kaip ir buvo minėta, gamtos
tyrimuose ir segmentuojamos miško, laukų ar ūkių nuotraukos, tačiau labai mažai tyrimų yra
padaryta segmentuojant miesto nuotraukas bei vaizdus, kur pavyzdžiui nustatomos vietos, kur
galima dronui leistis, arba įdentifikuojami judantys objektai. Šiame darbe bus nagrinėjama būtent
toks duomenų rinkinys – iš pakankamai arti padarytų miesto nuotraukų.
Šio darbo tikslas yra įgyvendinti drono nusileidimo vietos paieškos užduotį su pasirinktu
miesto nuotraukų, padarytų dronais duomenų rinkiniu naudojant skirtingas neuroninių tinklų
architekturas ir išrinkti labiausiai tinkamą tokio tipo užduočiai atlikti pagal išsirinktus kriterijus.
Šio darbo uždaviniai:
1. Išanalizuoti dronais išgautų nuotraukų duomenų rinkinius ir nuotraukų segmentavimo metodus.
2. Pagal išsikeltus kriterijus išsirinkti giliojo mokymosi architektūras užduočiai įgyvendinti
3. Realizuoti pasirinktas skirtingas neuroninių tinklų architektūras.
4. Sukurti duomenų rinkinį, kintančio mastelio įtakos vertinimui
5. Įvertinti, kaip kiekvienos architektūros tikslumą paveikia kintantis mastelis nuotraukose.
Mūsų mokslo darbų bazėje yra daugybė įvairių mokslo darbų, todėl tikrai atrasi sau tinkamą!