Tampering with Generative Artificial Intelligence by Jailbreaking

Corrado Claverini

doi:10.4454/mg6wax06

V. 44 N. 1 (2024): Topografie del rischio. Proposte teoriche

Articles

Manipolare l’intelligenza artificiale generativa attraverso il jailbreaking

Abbonamento o quota di accesso PDF (EUR 6)

Corrado Claverini

più informazioni

Corrado Claverini
Università del Salento

Pubblicato 2024-06-12

Parole chiave

Generative Artificial Intelligence,
ChatGPT,
AI ethics,
Jailbreaking,
regulation of AI

Come citare

Manipolare l’intelligenza artificiale generativa attraverso il jailbreaking. (2024). Teoria. Rivista Di Filosofia, 44(1). https://doi.org/10.4454/mg6wax06

Abstract

In questo articolo analizzerò i rischi legati all'utilizzo di sistemi di intelligenza artificiale generativa e le relative strategie di riduzione del rischio, concentrandomi in particolare sulla possibilità di manomettere il chatbot ChatGPT tramite jailbreak. Dopo aver esaminato come un utente possa manomettere questa IA generativa, aggirando le sue restrizioni etiche e legali, attraverso una serie di prompt, sposterò l'attenzione sulle questioni etiche sollevate dall'uso malevolo di questa tecnologia: i requisiti di trasparenza richiesti alle IA generative sono sufficienti o dovrebbero esserci restrizioni più severe che non ostacolino l'innovazione e lo sviluppo di queste tecnologie? Come si può ridurre il rischio di manomissione di questi strumenti di IA? E, in caso di violazione, chi è responsabile: lo sviluppatore dell'IA o il jailbreaker? In che misura i cambiamenti necessari per impedire il jailbreak potrebbero involontariamente generare o rafforzare alcuni pregiudizi? In conclusione, sosterrò la necessità di una riflessione etica per uno sviluppo sostenibile e “umano-centrico” dell'intelligenza artificiale.

Abbonamento o quota di accesso PDF (EUR 6)

Manipolare l’intelligenza artificiale generativa attraverso il jailbreaking

Parole chiave

Come citare

Scarica citazione

Abstract

Articoli simili