Bepiločių orlaivių nuotraukų semantinis
segmentavimas naudojant gilųjį neuroninį tinklą
Bakalaurinis darbas
Turinys
Santrauka.........................................................................................................................................2
Summary..........................................................................................................................................3
Įvadas...............................................................................................................................................6
1. Semantinis segmentavimas..................................................................................................8
2. Neuroninių tinklų pasirinkimas........................................................................................10
2.1. Kriterijai...........................................................................................................................10
2.2. Neuroninių tinklų palyginimas.........................................................................................10
2.2.1. Konvoliuciniai neuroniniai tinklai...............................................................................11
2.2.2. Transformerių neuroniniai tinklai................................................................................11
2.2.3. Rekurentiniai neuroniniai tinklai.................................................................................11
2.3. Pasirinkti neuroniniai tinklai............................................................................................12
3. Konvoliuciniai neuroniniai tinklai....................................................................................13
3.1. Konvoliucinis sluoksnis...................................................................................................14
3.2. Sutelkimo sluoksnis.........................................................................................................14
3.3. Aktyvacijos funkcija (ReLU)...........................................................................................15
3.4. Nuostolių funkcija............................................................................................................15
3.5. Konvoliucinių neuroninių tinklų privalumai....................................................................16
4. Transformerių neuroninis tinkas......................................................................................17
4.1. Dėmesio sutelkimo mechanizmas....................................................................................17
4.1.1. Dėmesio sutelkimo apskaičiavimas..............................................................................17
4.2. „Softmax“ funkcija..........................................................................................................18
4.3. Tiesioginio sklidimo tinklas.............................................................................................18
4.4. Galutinis išeities apdorojimas..........................................................................................18
4.5. Transformerių neuroninių tinklų privalumai....................................................................19
5. Konvoliucinių ir transformerių neuroninių tinklų architektūrų palyginimas...............20
6. Pasirinktų modelių analizė................................................................................................21
6.1. UNet++............................................................................................................................21
6.1.1. UNet++ architektūra....................................................................................................21
6.2. PSPNet.............................................................................................................................22
6.2.1. PSPNet architektūra.....................................................................................................22
6.3. SegFormer........................................................................................................................22
6.3.1. SegFormer architektūra................................................................................................23
7. Eksperimentas....................................................................................................................24
7.1. Programinė įranga ir įrankiai............................................................................................24
7.2. Duomenų rinkinys............................................................................................................24
7.3. Duomenų apdorojimas.....................................................................................................25
7.4. Metrikos...........................................................................................................................25
7.5. Modelių treniravimo rezultatai.........................................................................................26
7.5.1. UNet++........................................................................................................................26
7.5.2. PSPNet........................................................................................................................27
7.5.3. SegFormer MiT-b1......................................................................................................28
7.6. Bandymas su kintančio mastelio nuotraukomis................................................................29
8. Rezultatai ir išvados...........................................................................................................33
Šaltiniai...........................................................................................................................................35
Priedai............................................................................................................................................37
Įvadas
Bepilotis orlaivis, arba dažniau vadinamas – dronas, tai dažniausiai nuotoliniu būdu
valdomas orlaivis be įgulos. Dronai turi daug paskirčių. Jie naudojami sunkiai pasiekiamų
vietovių tyrimams, komerciniams tikslams, taip pat dronai dažnai naudojami kariniais tikslais –
žvalgybai ir kovinių operacijų vykdymui. Dronai nėra šių laikų naujovė, jie buvo išrasti dar I
Pasaulinio karo metu [Sat14]. Laikui bėgant jie tapo vis modernesni ir patogesni, dronai pradėjo
sugebėti išgauti vaizdinę, garsinę ir sensorinę informaciją.
Nuotraukų segmentavimas yra svarbus daugelyje sričių, tokių kaip autonominių
automobilių kūrimas, medicina, rentgeno nuotraukų nagrinėjimas, nuotolinis stebėjimas. Tačiau
šis uždavinys, naudojant bepiločių orlaivių išgautomis nuotraukomis, svarbus tvarių miestų
planavimui, tiksliajam (preciziniam) ūkininkavimui ir kariniams tikslams. Minėtose srityse
dažnai naudojami brangūs bepiločiai orlaiviai, naudojantys dirbtinį intelektą, todėl vienas
svarbiausių dirbtinio intelekto uždavinių šiuose dronuose yra tikslus nusileidimo vietos
aptikimas. Tokiems uždaviniams pasitelkiami giliųjų neuroninių tinklų modeliai, dažnai
naudojami semantiniame segmentavime. Šiose srityse svarbu išgauti aukštą skirtingų objektų
atpažinimo ir jų vietos tikslumą. Tačiau reikia atsižvelgti į dronų nuotraukų kokybę, jose esančių
tos pačios klasės objektų dydį, įvairias oro sąlygas ir kitus aspektus. Šiam uždaviniui sukurti
duomenų rinkiniai dažnai yra sudaryti tik iš geros kokybės nuotraukų, darytų esant geromis oro
sąlygomis, todėl apdorojant nuotraukas dažnai taikoma nuotraukų augmentacija, pridedami
triukšmo filtrai, šviesumo kontrasto iškraipymo transformacijos ir daugelis kitų. Nuotraukų
augmentacijos taikymas gali ne vien padidinti bendrą duomenų rinkinio informacijos kiekį, taip
suteikiant modeliui daugiau mokomosios medžiagos, tačiau ir sukurti labiau realistiškas
nuotraukas modelio mokymui. Neteisingai atpažintas objektas arba objekto vieta gali sukelti
didelius nuostolius. Todėl svarbu pasirinkti tinkamą modelį ir jį apmokyti su įvairiomis,
augmentuotomis nuotraukomis.
Darbo tikslas
Pagal iškeltus kriterijus rasti du tinkamiausius giliųjų neuroninių tinklų tipus, drono
nusileidimo vietos uždaviniui spręsti. Su jais atlikti semantinio segmentavimo užduotį su
pasirinktu duomenų rinkiniu ir sukurtu dronų nuotraukų duomenų rinkiniu, siekiant rasti
tinkamiausią neuroninio tinklo architektūrą nusileidimo vietos aptikimui iš skirtingų aukščių.
Mūsų mokslo darbų bazėje yra daugybė įvairių mokslo darbų, todėl tikrai atrasi sau tinkamą!