Hvordan kunstig intelligens genkender billeder

En af de mest almindelige opgaver, som neurale netværk skal løse, er visuel billedgenkendelse. I øjeblikket har maskiner til opgave at genkende tegn på papir, signaturer på dokumenter, billeder på fotografier eller realtidsvideo fra overvågningskameraer. Den høje effektivitet ved at udføre disse opgaver kan betydeligt forenkle folks arbejde, samt reducere sandsynligheden for fejl på grund af den menneskelige faktor. Men hvordan klarer et neuralt netværk denne opgave, og gør det det virkelig bedre end et menneske?

Hvordan kunstig intelligens genkender billeder. Neurale netværk kan genkende billeder mere præcist end mennesker. Fotokilde: scientificrussia.ru. Foto.

Neurale netværk kan genkende billeder mere præcist end mennesker. Fotokilde: scientificrussia.ru

Indhold

  • 1 Anvendelse af neurale netværk i billedgenkendelse
  • 2 Sådan sker det træning af et neuralt netværk
  • 3 Sådan genkender et neuralt netværk et billede
  • 4 Hvorfor neurale netværk genkender billeder mere effektivt end mennesker

Anvendelse af neurale netværk i billedgenkendelse

Midjourney neurale netværk og alle dets forskellige analoger, såsom Kandinsky, kan ikke kun generere deres egne billeder, men kan også “fuldføre” færdige billeder. For at løse dette problem og harmonisk komplementere billedet, skal du først genkende det. De fleste mennesker bruger sådanne neurale netværk for sjov.

Dog kan evnen til at genkende billeder, som nævnt ovenfor, bruges til at løse vigtigere problemer. Eksperter kalder f.eks. struktureringsbilleder modtaget fra alle kameraer i verden for et af de vigtigste anvendelsesområder for kunstig intelligens. Disse videostreams er et bibliotek af ustrukturerede data, så de er af ringe praktisk nytte.

Kunstig intelligens kan genkende video fra overvågningskameraer i realtid. Fotokilde: www.ucontrol.ru

Men ved at bruge kunstig intelligens kan alle disse data struktureres, på trods af at vi taler om en kolossal mængde information. Som et resultat heraf kan biblioteket bruges til en række forskellige formål, fra privat til professionelle og offentlige, herunder sikkerhed.

Hvordan foregår træning i neurale netværk?

Før ethvert problem løses, skal ethvert neuralt netværk gennemgå træning. Desuden er det lige meget, hvilken opgave vi taler om — genkende eller generere billeder, skrive tekster, som det er tilfældet med GPT-4, eller endda generere musik. Det vil sige, at AI's arbejde ligner den menneskelige hjernes arbejde. For eksempel analyserer vi et billede og identificerer det ud fra eksisterende viden.

Af denne grund kræver neurale netværk datasættet, det vil sige kvaliteten og mængden af ​​data, som de trænes på. Datasættet er som regel taget fra åbne kilder. I dette tilfælde er det altid vigtigt, at kildedataene for det neurale netværk er utvetydige og konsistente.

Kunstig intelligens trænes først nøje, så den kan løse givne problemer. Fotokilde: trainingdata.ru

Det skal siges, at der er forskellige strategier til træning af AI, men de bunder alle sammen til, at neurale netværk giver et datasæt til at studere. Samtidig kan AI med det samme rapportere, hvad det rigtige svar skal være eller slet ikke rapportere det, så det neurale netværk selv giver svaret ud fra sin egen analyse af bestemte funktioner. Nogle gange kombineres forskellige undervisningsstrategier.

For at gøre det lettere at forstå, hvordan et neuralt netværk fungerer, og læring sker, kan det repræsenteres som et træ, hvor hver gren — dette er et muligt svar. Desuden har hver gren en anden tykkelse eller forskellig “vægt”, men alle grene er indbyrdes forbundne. Under læringsprocessen analyserer det neurale netværk graden af ​​indflydelse fra en “gren” på en anden. De hyppigste resultater har en stor “vægt”, det vil sige en numerisk koefficient, der tildeles under træningsprocessen, og som det neurale netværk styres af, når resultatet produceres.

Når neurale netværk trænes til at genkende billeder, præsenteres de for forskellige prøver med en etiket, der angiver, hvilken type de er. Visse træk ved billedet bruges som eksempler, hvorfra der opstår mulige svarmuligheder, det vil sige de ovennævnte «grene». Sættet af funktioner gør det muligt for det neurale netværk entydigt at bestemme, hvilken klasse af billeder det har at gøre med. Derfor skal det neurale netværk under træningsprocessen lære at arbejde med et tilstrækkeligt antal funktioner for at genkende billeder, som det ikke kender, med høj nøjagtighed.

For at genkende et billede opdeler det neurale netværk det i dele og analyserer de funktioner, det kender. Fotokilde: habr.com

Sådan genkender et neuralt netværk et billede

Et trænet neuralt netværk har et godt udbud af viden, som gør det muligt at genkende et billede. Hvordan implementeres dette i praksis? Billedet er opdelt i små områder, ned til grupper på nogle få pixels, og derefter sammenlignes hundredtusindvis af sådanne grupper med kendte billeder og analyseres for tilstedeværelsen af ​​kendte funktioner. Kort sagt sammenligner kunstig intelligens billedet (dets individuelle dele) med den base, som det blev trænet på, og leder efter kampe.

Efter det neurale netværk genkender objekter i billedet, tildeler det dem en eller anden klasse. For eksempel, i et fotografi af en person, der sidder på en sofa med en kat i armene, adskiller det neurale netværk hvert objekt separat, det vil sige sofaen, personen, katten og endda tøjet på personen. Alle disse objekter tilhører forskellige klasser. Efterfølgende, når billedet genkendes, kan det neurale netværk udføre yderligere handlinger med det, for eksempel at tegne et meningsfuldt billede. I tilfælde af videoovervågning genkender det neurale netværk først billedet, det vil sige objekterne på det, og bestemmer derefter handlinger og klassificerer dem.

Et neuralt netværk kan genkende folks ansigter med matematisk nøjagtighed. Billedkilde: neurohive.io

Af alt ovenstående følger det, at jo flere funktioner det neurale netværk kender, jo mere nøjagtigt er resultatet. Men på et tidspunkt bliver huskefunktioner til blot at huske en prøve. For at producere en god nøjagtighed er det derfor vigtigt for et neuralt netværk ikke at “overtræne”, ellers vil det simpelthen tilpasse sig træningsprøven.

Hvorfor er neurale netværk mere effektive til at genkende billeder end mennesker

Hvorfor kan et neuralt netværk klare denne opgave mere effektivt end et menneske? Først og fremmest, som nævnt ovenfor, er den menneskelige faktor udelukket. For eksempel kan en person være distraheret, lave en fejl på grund af træthed osv. Derudover kan AI arbejde meget hurtigere og med en meget større mængde data.

Sørg for at besøge vores Zen- og Telegram-kanaler, her finder du de mest interessante nyheder fra videnskabens verden og de seneste opdagelser!

Dette gælder ikke kun billedgenkendelse, men også mange andre opgaver. For eksempel er det af denne grund, at neurale netværk kan gøre medicin billigere og mere tilgængelig. For eksempel blev COVID-19-vacciner udviklet ved hjælp af neurale netværk, hvilket fremskyndede deres udvikling betydeligt.


Date:

by