Opublikowano 10 maja 2026

VigilGuard Enterprise v1.7.2: nowy detektor v2h, integracja z Claude Code, rozszerzony kontrakt API

Kontekst wydania: agenty zmieniają wymagania wobec detekcji

W środowiskach agentowych model nie pracuje już na pojedynczej wiadomości użytkownika. Decyzja agenta powstaje z połączenia promptu użytkownika, polecenia systemowego, historii konwersacji oraz odpowiedzi narzędzi. Klasyczne klasyfikatory prompt injection, trenowane głównie na promptach konwersacyjnych, w takim ruchu generują nadmiar fałszywych alarmów na nieszkodliwych wynikach narzędzi i jednocześnie tracą część rzeczywistych ataków osadzonych w nietypowych formatach wejścia.

Wersja 1.7.2 odpowiada na ten rozdźwięk dwiema zmianami w samej detekcji oraz nową powierzchnią wdrożenia w środowisku Claude Code.

vge-promptguard-v2h: detektor z routingiem dopasowanym do typu wejścia

vge-promptguard-v2h zastępuje pojedynczy klasyfikator nową architekturą decyzyjną. W czasie rzeczywistym rozpoznawany jest typ wejścia, w tym klasyczny prompt użytkownika, wynik narzędzia, fragment kodu oraz tekst w języku polskim. Na tej podstawie analiza kierowana jest do ścieżki najlepiej dopasowanej do danego przypadku.

Dotychczasowy klasyfikator vge-promptguard-v1g pozostaje fundamentem rozwiązania. Uzupełnia go nowy komponent wyspecjalizowany w trudnych klasach ataków, dla których wcześniejsza generacja modeli wykazywała ograniczoną skuteczność.

Aktualizacja jest w pełni kompatybilna wstecz. Po wdrożeniu klienci nie wprowadzają zmian w integracji, a polityki bezpieczeństwa pozostają aktywne bez modyfikacji.

Metryka	Zmiana względem poprzedniej wersji detektora
Regresje na 19 zestawach ewaluacyjnych	brak
Fałszywe alarmy na wynikach narzędzi w Claude Code	minus 71 pp
Wykrywalność ataków na zestawie Moltbook	plus 87,5 pp
Wskaźnik fałszywych alarmów na BIPIA	minus 55 pp

vge-cc-guard: detekcja Vigil Guard wewnątrz Claude Code

Claude Code jest jednym z najszybciej rozwijających się agentowych środowisk deweloperskich. Każdy prompt wysłany w takim środowisku trafia do modelu wraz z całym kontekstem otaczającym, w tym fragmentami kodu, wynikami narzędzi i poleceniami systemowymi. Powierzchnia ataków jest tu szersza niż w klasycznym chatbocie, a jednocześnie do tej pory pozostawała poza zasięgiem dedykowanych warstw detekcji.

vge-cc-guard jest pierwszą oficjalną integracją Vigil Guard z Claude Code. Po jej aktywacji prompty wysyłane do modelu w Claude Code przechodzą przez detekcję Vigil Guard, zanim trafią do LLM. Bieżąca faza obejmuje analizę promptu użytkownika. Kolejne fazy rozszerzą zakres o wywołania narzędzi i zdarzenia cyklu życia agenta.

Połączenie vge-cc-guard z detektorem v2h przekłada się na wymierny efekt operacyjny w pracy zespołów inżynieryjnych korzystających z Claude Code: niższy szum alertowy oraz wyższa skuteczność detekcji w warstwie, w której dotychczas działały wyłącznie generyczne mechanizmy.

Rozszerzony kontrakt API: agent, narzędzie, konwersacja

Kontrakt API został rozszerzony o trzy opcjonalne pola opisujące kontekst zapytania: identyfikator agenta, identyfikator narzędzia oraz identyfikator konwersacji. Dodano także dwa nowe typy źródła wejścia: dane wejściowe narzędzia oraz prompt systemowy.

Zmiana jest opcjonalna i pozostaje w pełni kompatybilna wstecz. Istniejące integracje działają bez modyfikacji. W warstwie analitycznej operatorzy zyskują pełniejszy obraz tego, kto, w jakim kontekście i z jakim narzędziem odpytał Vigil Guard. Tworzy to bazę pod kontekstową ocenę ryzyka, która zostanie wprowadzona w kolejnych wydaniach.

Wydajność i przewidywalność operacyjna

Pipeline detekcji został zoptymalizowany pod kątem czasu odpowiedzi i stabilności pod obciążeniem. Wprowadzono twardy budżet czasowy pojedynczej analizy, który eliminuje sytuacje przekazywania spóźnionych werdyktów do wywołań, których termin już minął. Domyślnie aktywne jest dynamiczne grupowanie zapytań, wcześniej niedostępne w części scenariuszy wdrożeniowych. Ograniczono również ilość danych przekazywanych w odpowiedziach systemu, co zmniejsza powierzchnię potencjalnego wycieku treści promptu w transporcie.

Po stronie analityki i rozliczeń liczniki w dashboardach przestały podwajać niektóre zdarzenia, a endpoint zużycia wykorzystywany przez warstwę billingową działa znacząco szybciej. Logowanie pod obciążeniem jest stabilne dzięki kontrolowanemu mechanizmowi backpressure, z dedykowaną metryką dostępną w warstwie monitoringu.

Po stronie wdrożeń aktualizacja jest atomowa. Procedury migracji bazy analitycznej rozróżniają operacje lekkie i ciężkie, co skraca okno utrzymaniowe podczas upgrade'u i ogranicza ryzyko niepotrzebnego rebuildu zasobów po stronie klienta.

Linia 1.6.x i linia 1.7.x: różnica charakteru

Linia 1.6.x rozszerzała Vigil Guard o nowe gałęzie detekcji, w tym Scope Drift oraz dwuprzejściową analizę długich promptów. Linia 1.7.x koncentruje się na jakości samej detekcji oraz na nowych powierzchniach, w których Vigil Guard działa w środowiskach agentowych.

Aspekt	Linia 1.6.x	Linia 1.7.x
Główne zmiany	Scope Drift, dwuprzejściowa analiza długich promptów, kalibracja arbitra decyzji	Detektor vge-promptguard-v2h, integracja vge-cc-guard z Claude Code, rozszerzony kontrakt API
Charakter wydania	Nowe gałęzie detekcji	Wyższa jakość detekcji oraz nowe powierzchnie wejścia

Dostępność

VigilGuard Enterprise 1.7.2 jest dostępny dla wszystkich klientów objętych aktywnym wsparciem. Aktualizacja jest zalecana w pierwszej kolejności w środowiskach, w których agenty pracują z wynikami narzędzi, w szczególności w zespołach korzystających z Claude Code.