Ett forskarteam under ledning av cybersäkerhetsexperten Bimal Viswanath vid Virginia Tech har upptäckt en allvarlig säkerhetsbrist i dagens bildskyddstekniker, vilka är utformade för att förhindra att illvilliga aktörer stjäl innehåll på nätet för otillåten träning av artificiell intelligens, stilimitation och deepfake-manipulationer.
Studien har publicerats på preprint-servern arXiv.
Forskargruppen fann att angripare kan kringgå befintlig säkerhet med hjälp av färdiga modeller för artificiell intelligens (AI) och enkla kommandon. Vidare säger Viswanath: ”Det finns för närvarande inget idiotsäkert, matematiskt garanterat sätt för användare att skydda offentligt publicerade bilder mot en angripare som använder färdiga GenAI-modeller.”
Arbetet presenterades vid den fjärde IEEE-konferensen om säker och pålitlig maskininlärning i München, Tyskland. Bland författarna finns Viswanath, doktoranderna Xavier Pleimling och Sifat Muhammad Abdullah, biträdande professor Peng Gao, Murtuza Jadliwala från University of Texas i San Antonio samt Gunjan Balde och Mainack Mondal från Indian Institute of Technology i Kharagpur.
I takt med att AI-verktyg blir mer kraftfulla och tillgängliga belyser detta arbete det växande behovet av starkare cybersäkerhet, pålitlig AI, integritetsskydd och skydd inom digital kriminalteknik.
GenAI underlättar bedrägerier
Tidigare behövde bedragare använda specialiserade, specialutvecklade metoder för att kringgå bildsäkerhetstekniker som gjorde det svårt för illvilliga aktörer att använda autentiskt innehåll för deepfakes, identitetsstöld via ansiktsigenkänning eller imitation av konstnärlig stil.
”Men med hjälp av dagens färdiga, bild-till-bild-generativa AI-modeller och en enkel textprompt kunde våra forskare enkelt och effektivt kringgå ett brett spektrum av dessa skydd”, sade Viswanath.
De demonstrerade denna säkerhetsbrist i åtta fallstudier som spänner över sex olika skyddssystem. Sårbarheterna påverkar ett brett spektrum av försvar, inklusive perturbationer avsedda att skydda specifika semantiska egenskaper, såsom en persons ansiktsidentitet, osynligt ”skyddande brus” som tillämpas genom en AI:s latenta utrymme, och till och med robusta skydd som är specifikt utformade för att klara av efterföljande finjusteringsuppgifter.
”Vår allmänna attack kringgår inte bara dessa försvar utan överträffar faktiskt befintliga specialiserade attacker, samtidigt som bildens användbarhet för angriparen bevaras”, säger Viswanath.
En kapplöpning för att lösa ett växande problem
Detta arbete har avslöjat en kritisk och utbredd sårbarhet i det nuvarande landskapet för bildskydd, vilket bevisar att det inte längre räcker med att helt enkelt lägga till omärkbart skyddsbrus till en bild för att stoppa dataskrapare och förfalskare.
”Det är särskilt oroande eftersom nuvarande säkerhetsmetoder kan ge en falsk känsla av säkerhet”, säger Viswanath. ”Vi behöver omgående utveckla robusta försvar och säkerställa att alla framtida skyddsmekanismer kan försvara sig mot attacker från färdiga generativa AI-modeller.”
Detta innebär att cybersäkerhetsbranschen måste omvärdera sin strategi för att säkra visuellt innehåll fullständigt.
”Alla framtida skyddsmekanismer måste utvärderas strikt mot enkla, textstyrda attacker från allmänt tillgängliga, färdiga GenAI-modeller, inte bara mot specialiserade, specialbyggda attacker”, säger Viswanath. ”Forskare bör också notera att GenAI-bild-till-bild-modeller kommer att fortsätta förbättras med tiden, vilket potentiellt kan göra försvarsinsatserna svårare.”
Publikationsuppgifter
Xavier Pleimling et al, Off-The-Shelf Image-to-Image Models Are All You Need To Defeat Image Protection Schemes, arXiv (2026). DOI: 10.48550/arxiv.2602.22197