AIDR

AI DETECTION & RESPONSE

Jedyna platforma AI Security

z natywnym wsparciem języka polskiego

Każdy prompt. Każda odpowiedź. Każda interakcja z AI pod kontrolą. Pracownicy, aplikacje i autonomiczni agenci działają w ramach jednej warstwy bezpieczeństwa.

Natywne rozpoznawanie danych wrażliwych (PESEL, NIP, REGON), polska moderacja treści i zgodność z RODO.

Wspierani przez

POWIERZCHNIA ATAKU AI

Język stał się wektorem ataku

Prompt, odpowiedź modelu i działanie agenta to dziś realna powierzchnia ataku, której klasyczne narzędzia nie widzą.

naruszeń danych ma związek z nieautoryzowanym użyciem AI (Shadow AI)

IBM, 2025

organizacji, u których doszło do naruszenia modelu lub aplikacji AI, nie miało kontroli dostępu do tych systemów

IBM, 2025

33% → 0%

tak w rok wzrósł udział aktorów wykorzystujących AI w atakach o podwyższonym ryzyku

Anthropic, 2026

Shadow AI

Pracownicy wklejają wewnętrzne dokumenty do publicznych modeli, a Ty nie wiesz, kto, kiedy ani co tam trafiło.

Prompt injection

Spreparowane polecenie, podane wprost lub ukryte w treści, zmusza aplikację AI do działania poza swoimi regułami.

Przejęcie agenta

Autonomiczny agent wykonuje uprzywilejowaną akcję na cudze polecenie, reset hasła albo zmianę adresu e-mail, bez sprawdzenia, kto naprawdę pyta.

Dryf semantyczny

Asystent po cichu wychodzi poza swoją rolę: bot do obsługi faktur zaczyna doradzać w innych sprawach albo sięgać po dane spoza swojego kontekstu.

NAJTRUDNIEJSZY DO WYKRYCIA: INDIRECT PROMPT INJECTION

Atakujący nie pisze do modelu wprost. Ukrywa polecenie w treści, którą asystent i tak przetworzy: w mailu, dokumencie, opisie zgłoszenia, na stronie albo w powiadomieniu. Model wczytuje tę treść do tego samego kontekstu co polecenia użytkownika i wykonuje ją jako instrukcję, choć nikt jej świadomie nie wydał. W ten sposób agent może wysłać dane na zewnątrz albo wykonać akcję, której właściciel nigdy nie autoryzował.

Treść z zewnątrz i polecenie użytkownika docierają do modelu jako jeden ciąg tokenów. Model nie wie, co jest danymi, a co rozkazem. Tę granicę trzeba wymusić poza modelem, w czasie rzeczywistym.

JAK TO DZIAŁA

Jak działa Vigil Guard

Wszystkie decyzje są podejmowane w czasie rzeczywistym bez wpływu na wydajność aplikacji.

Wejście

Prompt, odpowiedź modelu albo akcja agenta trafia do Vigil Guard.

Detekcja

Równoległe branche analizują treść w jednym wywołaniu, w kilkaset milisekund.

Decyzja

Arbiter zwraca jeden werdykt: ALLOW, SANITIZE albo BLOCK.

Co wykrywamy

Prompt injection (wprost i pośredni) · Wykrywanie języka · Dryf semantyczny · Moderacja treści · Dane wrażliwe (PII) · Length Guard (limit tokenów)

Natywnie po polsku: PESEL, NIP, REGON i RODOOn-premise i air-gappedPełna integracja z SIEM, w chmurze i on-premise

Panel AIDR Vigil Guard z podglądem wykrywania ataków prompt injection w czasie rzeczywistym

Kompatybilny z

Kompletna platforma bezpieczeństwa AI

Monitoruj, kontroluj i zabezpiecz każdą interakcję z AI w organizacji, od narzędzi pracowników po autonomicznych agentów.

Ochrona przed prompt injection

Wielowarstwowe wykrywanie blokuje złośliwe instrukcje, zanim dotrą do systemów AI.

Dowiedz się więcej

Wykrywanie języka

Rozpoznaje 22 języki z polityką ALLOW lub BLOCK per język. Każdy prompt trafia do modeli detekcji i słowników specyficznych dla danego języka.

Dowiedz się więcej

Wykrywanie dryfu semantycznego

Klasyfikuje każdy prompt jako ON, NEAR lub OFF_SCOPE względem zakresu asystenta. Per klucz API, reguły szyfrowane AES, 3 poziomy czułości.

Dowiedz się więcej

Ochrona PII

Automatyczne wykrywanie, filtrowanie i maskowanie wrażliwych danych w wejściach i wyjściach AI.

Dowiedz się więcej

Widoczność Shadow AI

Rozszerzenie przeglądarki monitoruje wiodące platformy AI: ChatGPT, Claude, Gemini, Copilot, Copilot O365, Perplexity, DeepSeek, Grok, Poe, Mistral, Meta AI, Character.AI, Bielik, Z.ai i wiele innych. Pełny audit trail dla każdej interakcji.

Dowiedz się więcej

Bezpieczeństwo agentów AI

Kontrola runtime dla autonomicznych agentów. ALLOW, SANITIZE lub BLOCK w czasie rzeczywistym.

Dowiedz się więcej

Moderacja treści

Kontrola nad treściami generowanymi przez AI z natywną moderacją w 8 językach (PL, EN, FR, ES, IT, PT, TR, RU).

Dowiedz się więcej

Wdrożenia w środowiskach izolowanych

100% on-premises w Docker. Zero zewnętrznych zależności. Minimalne wymagania: serwer Linux z Dockerem, 32 GB RAM, 20 wątków CPU; wyższe w zależności od skali.

Dowiedz się więcej

Integracja SIEM

Natywny eksport CEF lub JSON przez TCP i TLS do Splunk, IBM QRadar, Microsoft Sentinel, Elastic SIEM lub dowolnego kolektora syslog.

Dowiedz się więcej

Potwierdzona skuteczność

0%¹

Detekcja ataków pośrednich / RAG

0%²

Fałszywe alarmy na nieszkodliwym ruchu

0%³

Detekcja jailbreaków

Vigil Guard 1.8.x przetestowany na dziewięciu publicznych, zewnętrznych benchmarkach wymienionych poniżej. Kluczowe wyniki: wykrywalność ataków pośrednich i RAG na recenzowanym zbiorze indirect-pia (ACL 2025), fałszywe alarmy na zbiorze deepset, jailbreaki na JailbreakBench. Każdą z tych liczb można odtworzyć z publicznego źródła.

1Detekcja ataków pośrednich / RAG: 99,2% wykrywalności na indirect-pia-detection (Chen i in., ACL 2025), recenzowanym zbiorze prompt injection pośrednich i RAG.
2Fałszywe alarmy na nieszkodliwym ruchu: 0,0% na deepset/prompt-injections, 0 z 56 nieszkodliwych promptów zablokowanych.
3Detekcja jailbreaków: 100% wykrywalności na JailbreakBench.

Dziewięć publicznych benchmarków

BIPIA (Microsoft)indirect-pia-detection (ACL 2025)pangea-aiguard-lab JailbreakBench TeleAI-Safety deepset/prompt-injections NotInject llm-pieval (Amazon)WAInjectBench

Detekcja najtrudniejszych ataków: pośrednie prompt injection i RAG

Wykrywalność ataków na benchmarku indirect-pia. Wyżej znaczy lepiej.

Vigil Guard 1.8

99,2%

Trenowane detektory *

97 do 99%

Meta Prompt-Guard

do 86%

LlamaGuard-3

≤ 39,1%

* Detektory trenowane na tym właśnie zbiorze (DeBERTa i Qwen2). Vigil Guard 1.8 osiąga ten poziom bez trenowania na nim.

Źródło: Chen i in., ACL 2025 (arxiv 2502.16580)

Czystość na realnym ruchu: over-defense

Benchmark NotInject, dokładność na nieszkodliwym ruchu. Wyżej znaczy mniej fałszywych alarmów.

LlamaGuard-3

99,7%

Vigil Guard 1.8

97,4%

Lakera Guard

87,6%

GPT-4o

86,7%

ProtectAI v2

56,6%

Meta Prompt-Guard

0,9%

LlamaGuard-3 jako jedyny jest tu czystszy, ale wykrywa poniżej 40% ataków pośrednich. Vigil Guard 1.8 jako jedyny jest mocny w obu naraz.

Źródło: PIGuard / InjecGuard, ACL 2025 (arxiv 2410.22770)

Dla kogo

Zespoły bezpieczeństwa

Widoczność, kontrola i audytowalność.

Zespoły AI / Platform

Bezpieczeństwo bez spowalniania innowacji.

Risk & Compliance

Mniejsze ryzyko związane z AI i lepsza gotowość do audytu. Zgodność z RODO.

Nie możesz zabezpieczyć tego, czego nie widzisz.

AI jest już częścią Twojego środowiska. Vigil Guard pokazuje każdy prompt i odpowiedź oraz blokuje prompt injection i wyciek danych.