Insecure Output Handling in Large Language Models / Niebezpieczne przetwarzanie danych wyjściowych w dużych modelach językowych

Anchimiuk, Aleksander

Insecure Output Handling in Large Language Models / Niebezpieczne przetwarzanie danych wyjściowych w dużych modelach językowych

dc.contributor.author	Anchimiuk, Aleksander
dc.date.accessioned	2026-06-10T08:19:56Z
dc.date.available	2026-06-10T08:19:56Z
dc.date.issued	2025
dc.description.abstract	Large Language Models (LLMs) are increasingly deployed across domains such as automation, healthcare, and software development. While existing research predominantly focuses on input-related risks, such as prompt injection and adversarial attacks, the critical challenge of Insecure Output Handling (IOH), as identified by the OWASP Top 10 for LLMs, remains understudied in the academic literature. This paper addresses this gap by providing a formal analysis of IOH as a distinct security threat, in which modelgenerated outputs introduce vulnerabilities into downstream systems. Through controlled experiments focusing on XSS vulnerabilities, we demonstrate significant variation in model security postures, with baseline exploit rates ranging from 4.2% to 27.6% across different architectures. Crucially, our findings validate OWASP’s concerns by showing that standard sanitisation techniques, recommended to mitigate IOH, provide 100% protection against successful XSS exploits in our experimental setup while maintaining negligible performance overhead. Furthermore, we examine how the European Union’s AI Act establishes concrete obligations for addressing such risks, positioning IOH mitigation not just as a technical best practice but as a regulatory imperative. The empirical evidence presented demonstrates that implementing output validation is both technically feasible and increasingly necessary for the deployment of compliant AI systems.
dc.description.abstract	Modele językowe dużej skali (LLM) są coraz częściej wykorzystywane w różnych dziedzinach, takich jak automatyzacja, opieka zdrowotna czy rozwój oprogramowania. Podczas gdy dotychczasowe badania koncentrują się głównie na zagrożeniach związanych z danymi wejściowymi, takich jak wstrzykiwanie promptów czy ataki adwersarialne, kluczowe wyzwanie, jakim jest niebezpieczne przetwarzanie danych wyjściowych (Insecure Output Handling, IOH) – zidentyfikowane przez listę OWASP Top 10 dla LLM – pozostaje słabo zbadane w literaturze naukowej. Niniejszy rozdział wypełnia tę lukę, dostarczając formalną analizę IOH jako odrębnego zagrożenia dla bezpieczeństwa, w ramach której generowane przez modele dane wyjściowe wprowadzają podatności do systemów je wykorzystujących. Na podstawie kontrolowanych eksperymentów dotyczących podatności typu XSS wykazano istotne różnice w poziomie bezpieczeństwa różnych architektur modeli – odsetek udanego wykorzystania podatności w badanej próbie wynosił od 4,2% do 27,6%. Co istotne, wyniki weryfikują obawy OWASP, pokazując, że w przeprowadzonym eksperymencie XSS standardowe techniki sanityzacji – rekomendowane do mitygacji IOH – zapewniły 100% ochrony przed skutecznymi atakami w badanej próbie, przy jednoczesnym minimalnym wpływie na wydajność. Ponadto rozdział analizuje, w jaki sposób Rozporządzenie UE o Sztucznej Inteligencji (AI Act) nakłada konkretne obowiązki w zakresie ograniczania tego typu ryzyk, czyniąc łagodzenie skutków IOH nie tylko najlepszą praktyką techniczną, lecz także wymogiem regulacyjnym. Przedstawione dane empiryczne dowodzą, że wdrożenie walidacji danych wyjściowych jest zarówno technicznie wykonalne, jak i coraz bardziej niezbędne dla zgodnego z przepisami wdrażania systemów AI.	pl
dc.identifier.isbn	978-83-68103-30-4
dc.identifier.uri	https://doi.org/10.29316/9788368103304_1
dc.identifier.uri	https://hdl.handle.net/20.500.13044/2566
dc.language.iso	en
dc.publisher	Akademia Bialska im. Jana Pawła II
dc.subject	AI security	en
dc.subject	large language models (LLMs)	en
dc.subject	insecure output handling	en
dc.subject	application security	en
dc.subject	cross-site scripting (XSS)	en
dc.subject	bezpieczeństwo AI,	pl
dc.subject	modele językowe dużej skali (LLM)	pl
dc.subject	niebezpieczne przetwarzanie danych wyjściowych (Insecure Output Handling, IOH)	pl
dc.subject	bezpieczeństwo aplikacji, cross-site scripting (XSS)	pl
dc.subject	sanityzacja danych wyjściowych	pl
dc.title	Insecure Output Handling in Large Language Models / Niebezpieczne przetwarzanie danych wyjściowych w dużych modelach językowych	pl
dc.type	Book chapter

Pliki

Oryginalny pakiet

Aktualna strona 1 - 1 z 1

Nazwa:: Insecure Output Handling in Large Language Models.pdf
Rozmiar:: 437.63 KB
Format:: Adobe Portable Document Format
Opis:

Pobierz

Pakiet licencji

Aktualna strona 1 - 1 z 1

Nazwa:: license.txt
Rozmiar:: 652 B
Format:: Item-specific license agreed to upon submission
Opis:

Pobierz

Kolekcje

Książki/rozdziały (WU)