Powrót do aktualności

VigilGuard Enterprise v1.7.2: nowy detektor v2h, integracja z Claude Code, rozszerzony kontrakt API

Kontekst wydania: agenty zmieniają wymagania wobec detekcji

W środowiskach agentowych model nie pracuje już na pojedynczej wiadomości użytkownika. Decyzja agenta powstaje z połączenia promptu użytkownika, polecenia systemowego, historii konwersacji oraz odpowiedzi narzędzi. Klasyczne klasyfikatory prompt injection, trenowane głównie na promptach konwersacyjnych, w takim ruchu generują nadmiar fałszywych alarmów na nieszkodliwych wynikach narzędzi i jednocześnie tracą część rzeczywistych ataków osadzonych w nietypowych formatach wejścia.

Wersja 1.7.2 odpowiada na ten rozdźwięk dwiema zmianami w samej detekcji oraz nową powierzchnią wdrożenia w środowisku Claude Code.

vge-promptguard-v2h: detektor z routingiem dopasowanym do typu wejścia

vge-promptguard-v2h zastępuje pojedynczy klasyfikator nową architekturą decyzyjną. W czasie rzeczywistym rozpoznawany jest typ wejścia, w tym klasyczny prompt użytkownika, wynik narzędzia, fragment kodu oraz tekst w języku polskim. Na tej podstawie analiza kierowana jest do ścieżki najlepiej dopasowanej do danego przypadku.

Dotychczasowy klasyfikator vge-promptguard-v1g pozostaje fundamentem rozwiązania. Uzupełnia go nowy komponent wyspecjalizowany w trudnych klasach ataków, dla których wcześniejsza generacja modeli wykazywała ograniczoną skuteczność.

Aktualizacja jest w pełni kompatybilna wstecz. Po wdrożeniu klienci nie wprowadzają zmian w integracji, a polityki bezpieczeństwa pozostają aktywne bez modyfikacji.

MetrykaZmiana względem poprzedniej wersji detektora
Regresje na 19 zestawach ewaluacyjnychbrak
Fałszywe alarmy na wynikach narzędzi w Claude Codeminus 71 pp
Wykrywalność ataków na zestawie Moltbookplus 87,5 pp
Wskaźnik fałszywych alarmów na BIPIAminus 55 pp

vge-cc-guard: detekcja Vigil Guard wewnątrz Claude Code

Claude Code jest jednym z najszybciej rozwijających się agentowych środowisk deweloperskich. Każdy prompt wysłany w takim środowisku trafia do modelu wraz z całym kontekstem otaczającym, w tym fragmentami kodu, wynikami narzędzi i poleceniami systemowymi. Powierzchnia ataków jest tu szersza niż w klasycznym chatbocie, a jednocześnie do tej pory pozostawała poza zasięgiem dedykowanych warstw detekcji.

vge-cc-guard jest pierwszą oficjalną integracją Vigil Guard z Claude Code. Po jej aktywacji prompty wysyłane do modelu w Claude Code przechodzą przez detekcję Vigil Guard, zanim trafią do LLM. Bieżąca faza obejmuje analizę promptu użytkownika. Kolejne fazy rozszerzą zakres o wywołania narzędzi i zdarzenia cyklu życia agenta.

Połączenie vge-cc-guard z detektorem v2h przekłada się na wymierny efekt operacyjny w pracy zespołów inżynieryjnych korzystających z Claude Code: niższy szum alertowy oraz wyższa skuteczność detekcji w warstwie, w której dotychczas działały wyłącznie generyczne mechanizmy.

Rozszerzony kontrakt API: agent, narzędzie, konwersacja

Kontrakt API został rozszerzony o trzy opcjonalne pola opisujące kontekst zapytania: identyfikator agenta, identyfikator narzędzia oraz identyfikator konwersacji. Dodano także dwa nowe typy źródła wejścia: dane wejściowe narzędzia oraz prompt systemowy.

Zmiana jest opcjonalna i pozostaje w pełni kompatybilna wstecz. Istniejące integracje działają bez modyfikacji. W warstwie analitycznej operatorzy zyskują pełniejszy obraz tego, kto, w jakim kontekście i z jakim narzędziem odpytał Vigil Guard. Tworzy to bazę pod kontekstową ocenę ryzyka, która zostanie wprowadzona w kolejnych wydaniach.

Wydajność i przewidywalność operacyjna

Pipeline detekcji został zoptymalizowany pod kątem czasu odpowiedzi i stabilności pod obciążeniem. Wprowadzono twardy budżet czasowy pojedynczej analizy, który eliminuje sytuacje przekazywania spóźnionych werdyktów do wywołań, których termin już minął. Domyślnie aktywne jest dynamiczne grupowanie zapytań, wcześniej niedostępne w części scenariuszy wdrożeniowych. Ograniczono również ilość danych przekazywanych w odpowiedziach systemu, co zmniejsza powierzchnię potencjalnego wycieku treści promptu w transporcie.

Po stronie analityki i rozliczeń liczniki w dashboardach przestały podwajać niektóre zdarzenia, a endpoint zużycia wykorzystywany przez warstwę billingową działa znacząco szybciej. Logowanie pod obciążeniem jest stabilne dzięki kontrolowanemu mechanizmowi backpressure, z dedykowaną metryką dostępną w warstwie monitoringu.

Po stronie wdrożeń aktualizacja jest atomowa. Procedury migracji bazy analitycznej rozróżniają operacje lekkie i ciężkie, co skraca okno utrzymaniowe podczas upgrade'u i ogranicza ryzyko niepotrzebnego rebuildu zasobów po stronie klienta.

Linia 1.6.x i linia 1.7.x: różnica charakteru

Linia 1.6.x rozszerzała Vigil Guard o nowe gałęzie detekcji, w tym Scope Drift oraz dwuprzejściową analizę długich promptów. Linia 1.7.x koncentruje się na jakości samej detekcji oraz na nowych powierzchniach, w których Vigil Guard działa w środowiskach agentowych.

AspektLinia 1.6.xLinia 1.7.x
Główne zmianyScope Drift, dwuprzejściowa analiza długich promptów, kalibracja arbitra decyzjiDetektor vge-promptguard-v2h, integracja vge-cc-guard z Claude Code, rozszerzony kontrakt API
Charakter wydaniaNowe gałęzie detekcjiWyższa jakość detekcji oraz nowe powierzchnie wejścia

Dostępność

VigilGuard Enterprise 1.7.2 jest dostępny dla wszystkich klientów objętych aktywnym wsparciem. Aktualizacja jest zalecana w pierwszej kolejności w środowiskach, w których agenty pracują z wynikami narzędzi, w szczególności w zespołach korzystających z Claude Code.