Iš anksto apmokytų modelių taikymas sentimentų analizės uždavinio sprendimui
Baigiamasis bakalauro darbas
TURINYS
SANTRAUKA...............................................................................................................4
SUMMARY..................................................................................................................5
1. ĮVADAS.............................................................................................................................................6
2. ANALITINĖ DALIS..........................................................................................................................7
2.1. Sentimentų analizė............................................................................................................7
2.2. Klasifikavimo technikos................................................................................7
2.3. Sentimentų analizės literatūros apžvalga.................................................................9
2.3.1. Klasifikavimo algoritmų literatūros apžvalga...................................................9
2.3.2. Iš anksto apmokytų modelių literatūros apžvalga.......................................11
2.4. Duomenų rinkiniai............................................................................................................13
3. METODINĖ DALIS.......................................................................................................................15
3.1. Pirminis teksto apdorojimas.......................................................................15
3.2. Tekstinių požymių išskyrimas......................................................................................15
3.3. Klasifikavimo technikos..............................................................................15
3.3.1. Logistinės regresijos algoritmas.........................................................................16
3.3.2. Atraminių vektorių algoritmas............................................................................16
3.3.3. BERT modelis......................................................................................16
3.3.4. RoBERTa modelis................................................................................18
3.4. Metrikos ir vertinimas.................................................................................19
4. ĮGYVENDINIMO DALIS...............................................................................................................21
4.1. Duomenų rinkiniai............................................................................................................21
4.2. Aplinka, bibliotekos....................................................................................21
4.3. BERT modelio rezultatai.............................................................................22
4.4. RoBERTa modelio rezultatai.......................................................................24
4.5. Logistinės regresijos modelio rezultatai..................................................................26
4.6. Atraminių vektorių modelio rezultatai......................................................................26
4.7. Testavimas su skirtingais duomenų rinkiniais.......................................................27
5. REZULTATAI IR APIBENDRINIMAS.......................................................................28
LITERATŪRA.........................................................................................................................................29
1. ĮVADAS
Baigiamojo darbo tema – iš anksto apmokytų modelių taikymas sentimentų analizės
uždavinio sprendimui.
Iš anksto apmokytų modelių taikymas sentimentų analizei yra itin aktualus šiandieninėje
duomenimis pagrįstoje visuomenėje. Sparčiai augant socialinės žiniasklaidos ir internetinio
turinio kiekiui, įmonėms, valdžios institucijoms ir tyrėjams labai svarbu tiksliai įvertinti
visuomenės nuotaikas. Eksperimentuojant ir pritaikant įvairias teksto apdorojimo ir
klasifikavimo technikas šiame darbe siekiama prisidėti prie sentimentų analizės uždavinio
sprendimo gerinimo, išsiaiškinti koks iš anksto apmokytas modelis yra tinkamesnis sprendžiant
šį uždavinį.
Tikslas – pritaikyti iš anksto apmokytus modelius sentimentų analizės uždavinio
sprendimui, palyginti juos su tradiciniais klasifikavimo algoritmais.
Uždaviniai:
1. Atlikti esamų iš anksto apmokytų modelių analizę bei atrinkti kelis tinkamiausius
modelius savo baigiamojo darbo tikslui įgyvendinti.
2. Išnagrinėti sentimentų analizės uždavinio sprendimui sukurtus duomenų rinkinius
ir du pasirinktus duomenų rinkinius pritaikyti savo tyrimui.
3. Pritaikyti iš anksto apmokytus modelius bei tradicinius algoritmus sentimentų
analizės uždaviniui spręsti.
4. Gautus modelių tikslumus palyginti tarpusavyje.
Baigiamąjįdarbąsudarošešiosdalys:įvadas,analitinėdalis,metodinėdalis,
įgyvendinamas, rezultatai ir apibendrinimas, literatūros sąrašas.
2. ANALITINĖ DALIS
Šiame skyriuje aptariamos pagrindinės sąvokos, nurodoma koks pasirinktas uždavinys bus
sprendžiamas, kokie modeliai bus taikomi uždavinio sprendimui bei atliekama literatūros
apžvalga įvairių straipsnių.
Mūsų mokslo darbų bazėje yra daugybė įvairių mokslo darbų, todėl tikrai atrasi sau tinkamą!