Home

AIsäkerhet

AIsäkerhet, eller AI-säkerhet på svenska, är fältet som arbetar med att försäkra att artificiell intelligens uppför sig på ett säkert, förutsägbart och etiskt försvarbart sätt. Det omfattar teknik, policy och samhälleliga frågor genom hela livscykeln från design och utveckling till implementering och övervakning.

Huvudområden inkluderar värdeanpassning (alignment), robusthet och tillförlitlighet, tolkbarhet samt säkerhet och integritet. Begreppen outer alignment och

Metoder och tekniker inom AIsäkerhet innefattar verifiering och formella metoder, testning och röd-teaming, sandboxing och säkra

Styrning och etik inom fältet fokuserar på standarder, regler och ansvarsutkrävande, transparenta utvecklingsprocesser och revision av

Tillämpningar och utmaningar inkluderar säkra system inom kritiska domäner som hälso- och sjukvård, transport och finans.

Forskning och samhälle inom AIsäkerhet är en växande disciplin där forskare, företag och myndigheter samarbetar för

inner
alignment
används
för
att
beskriva
hur
systemets
mål
och
beteende
överensstämmer
med
mänskliga
värderingar
och
hur
modellen
själv
utvecklar
mål
som
kan
avvika
från
det
avsedda.
utforskningsmiljöer,
samt
kontinuerlig
övervakning
och
avstängningsmekanismer
för
att
hantera
felaktigt
beteende
eller
hot.
system
samt
användning
av
mänsklig
inblandning
där
det
krävs.
Dessa
komponenter
syftar
till
att
skapa
ansvar
och
förtroende
i
användningen
av
AI.
Utmaningar
är
bland
annat
avvägningar
mellan
säkerhet
och
nytta,
dataskydd,
bias
och
missbruk
samt
hur
man
hanterar
risker
kopplade
till
långsiktig
utveckling
av
avancerad
AI.
att
göra
AI
säkrare
utan
att
hindra
innovation.