Insecure Output Handling in Large Language Models / Niebezpieczne przetwarzanie danych wyjściowych w dużych modelach językowych

dc.contributor.author Anchimiuk, Aleksander
dc.date.accessioned 2026-06-10T08:19:56Z
dc.date.available 2026-06-10T08:19:56Z
dc.date.issued 2025
dc.description.abstract Large Language Models (LLMs) are increasingly deployed across domains such as automation, healthcare, and software development. While existing research predominantly focuses on input-related risks, such as prompt injection and adversarial attacks, the critical challenge of Insecure Output Handling (IOH), as identified by the OWASP Top 10 for LLMs, remains understudied in the academic literature. This paper addresses this gap by providing a formal analysis of IOH as a distinct security threat, in which modelgenerated outputs introduce vulnerabilities into downstream systems. Through controlled experiments focusing on XSS vulnerabilities, we demonstrate significant variation in model security postures, with baseline exploit rates ranging from 4.2% to 27.6% across different architectures. Crucially, our findings validate OWASP’s concerns by showing that standard sanitisation techniques, recommended to mitigate IOH, provide 100% protection against successful XSS exploits in our experimental setup while maintaining negligible performance overhead. Furthermore, we examine how the European Union’s AI Act establishes concrete obligations for addressing such risks, positioning IOH mitigation not just as a technical best practice but as a regulatory imperative. The empirical evidence presented demonstrates that implementing output validation is both technically feasible and increasingly necessary for the deployment of compliant AI systems.
dc.description.abstract Modele językowe dużej skali (LLM) są coraz częściej wykorzystywane w różnych dziedzinach, takich jak automatyzacja, opieka zdrowotna czy rozwój oprogramowania. Podczas gdy dotychczasowe badania koncentrują się głównie na zagrożeniach związanych z danymi wejściowymi, takich jak wstrzykiwanie promptów czy ataki adwersarialne, kluczowe wyzwanie, jakim jest niebezpieczne przetwarzanie danych wyjściowych (Insecure Output Handling, IOH) – zidentyfikowane przez listę OWASP Top 10 dla LLM – pozostaje słabo zbadane w literaturze naukowej. Niniejszy rozdział wypełnia tę lukę, dostarczając formalną analizę IOH jako odrębnego zagrożenia dla bezpieczeństwa, w ramach której generowane przez modele dane wyjściowe wprowadzają podatności do systemów je wykorzystujących. Na podstawie kontrolowanych eksperymentów dotyczących podatności typu XSS wykazano istotne różnice w poziomie bezpieczeństwa różnych architektur modeli – odsetek udanego wykorzystania podatności w badanej próbie wynosił od 4,2% do 27,6%. Co istotne, wyniki weryfikują obawy OWASP, pokazując, że w przeprowadzonym eksperymencie XSS standardowe techniki sanityzacji – rekomendowane do mitygacji IOH – zapewniły 100% ochrony przed skutecznymi atakami w badanej próbie, przy jednoczesnym minimalnym wpływie na wydajność. Ponadto rozdział analizuje, w jaki sposób Rozporządzenie UE o Sztucznej Inteligencji (AI Act) nakłada konkretne obowiązki w zakresie ograniczania tego typu ryzyk, czyniąc łagodzenie skutków IOH nie tylko najlepszą praktyką techniczną, lecz także wymogiem regulacyjnym. Przedstawione dane empiryczne dowodzą, że wdrożenie walidacji danych wyjściowych jest zarówno technicznie wykonalne, jak i coraz bardziej niezbędne dla zgodnego z przepisami wdrażania systemów AI. pl
dc.identifier.isbn 978-83-68103-30-4
dc.identifier.uri https://doi.org/10.29316/9788368103304_1
dc.identifier.uri https://hdl.handle.net/20.500.13044/2566
dc.language.iso en
dc.publisher Akademia Bialska im. Jana Pawła II
dc.subject AI security en
dc.subject large language models (LLMs) en
dc.subject insecure output handling en
dc.subject application security en
dc.subject cross-site scripting (XSS) en
dc.subject bezpieczeństwo AI, pl
dc.subject modele językowe dużej skali (LLM) pl
dc.subject niebezpieczne przetwarzanie danych wyjściowych (Insecure Output Handling, IOH) pl
dc.subject bezpieczeństwo aplikacji, cross-site scripting (XSS) pl
dc.subject sanityzacja danych wyjściowych pl
dc.title Insecure Output Handling in Large Language Models / Niebezpieczne przetwarzanie danych wyjściowych w dużych modelach językowych pl
dc.type Book chapter
Pliki
Oryginalny pakiet
Aktualna strona 1 - 1 z 1
Miniatura obrazu
Nazwa:
Insecure Output Handling in Large Language Models.pdf
Rozmiar:
437.63 KB
Format:
Adobe Portable Document Format
Opis:
Pakiet licencji
Aktualna strona 1 - 1 z 1
Brak dostępnej miniatury
Nazwa:
license.txt
Rozmiar:
652 B
Format:
Item-specific license agreed to upon submission
Opis: