VigilGuard Enterprise v1.7.2: nowy detektor v2h, integracja z Claude Code, rozszerzony kontrakt API
Kontekst wydania: agenty zmieniają wymagania wobec detekcji
W środowiskach agentowych model nie pracuje już na pojedynczej wiadomości użytkownika. Decyzja agenta powstaje z połączenia promptu użytkownika, polecenia systemowego, historii konwersacji oraz odpowiedzi narzędzi. Klasyczne klasyfikatory prompt injection, trenowane głównie na promptach konwersacyjnych, w takim ruchu generują nadmiar fałszywych alarmów na nieszkodliwych wynikach narzędzi i jednocześnie tracą część rzeczywistych ataków osadzonych w nietypowych formatach wejścia.
Wersja 1.7.2 odpowiada na ten rozdźwięk dwiema zmianami w samej detekcji oraz nową powierzchnią wdrożenia w środowisku Claude Code.
vge-promptguard-v2h: detektor z routingiem dopasowanym do typu wejścia
vge-promptguard-v2h zastępuje pojedynczy klasyfikator nową architekturą decyzyjną. W czasie rzeczywistym rozpoznawany jest typ wejścia, w tym klasyczny prompt użytkownika, wynik narzędzia, fragment kodu oraz tekst w języku polskim. Na tej podstawie analiza kierowana jest do ścieżki najlepiej dopasowanej do danego przypadku.
Dotychczasowy klasyfikator vge-promptguard-v1g pozostaje fundamentem rozwiązania. Uzupełnia go nowy komponent wyspecjalizowany w trudnych klasach ataków, dla których wcześniejsza generacja modeli wykazywała ograniczoną skuteczność.
Aktualizacja jest w pełni kompatybilna wstecz. Po wdrożeniu klienci nie wprowadzają zmian w integracji, a polityki bezpieczeństwa pozostają aktywne bez modyfikacji.
| Metryka | Zmiana względem poprzedniej wersji detektora |
|---|---|
| Regresje na 19 zestawach ewaluacyjnych | brak |
| Fałszywe alarmy na wynikach narzędzi w Claude Code | minus 71 pp |
| Wykrywalność ataków na zestawie Moltbook | plus 87,5 pp |
| Wskaźnik fałszywych alarmów na BIPIA | minus 55 pp |
vge-cc-guard: detekcja Vigil Guard wewnątrz Claude Code
Claude Code jest jednym z najszybciej rozwijających się agentowych środowisk deweloperskich. Każdy prompt wysłany w takim środowisku trafia do modelu wraz z całym kontekstem otaczającym, w tym fragmentami kodu, wynikami narzędzi i poleceniami systemowymi. Powierzchnia ataków jest tu szersza niż w klasycznym chatbocie, a jednocześnie do tej pory pozostawała poza zasięgiem dedykowanych warstw detekcji.
vge-cc-guard jest pierwszą oficjalną integracją Vigil Guard z Claude Code. Po jej aktywacji prompty wysyłane do modelu w Claude Code przechodzą przez detekcję Vigil Guard, zanim trafią do LLM. Bieżąca faza obejmuje analizę promptu użytkownika. Kolejne fazy rozszerzą zakres o wywołania narzędzi i zdarzenia cyklu życia agenta.
Połączenie vge-cc-guard z detektorem v2h przekłada się na wymierny efekt operacyjny w pracy zespołów inżynieryjnych korzystających z Claude Code: niższy szum alertowy oraz wyższa skuteczność detekcji w warstwie, w której dotychczas działały wyłącznie generyczne mechanizmy.
Rozszerzony kontrakt API: agent, narzędzie, konwersacja
Kontrakt API został rozszerzony o trzy opcjonalne pola opisujące kontekst zapytania: identyfikator agenta, identyfikator narzędzia oraz identyfikator konwersacji. Dodano także dwa nowe typy źródła wejścia: dane wejściowe narzędzia oraz prompt systemowy.
Zmiana jest opcjonalna i pozostaje w pełni kompatybilna wstecz. Istniejące integracje działają bez modyfikacji. W warstwie analitycznej operatorzy zyskują pełniejszy obraz tego, kto, w jakim kontekście i z jakim narzędziem odpytał Vigil Guard. Tworzy to bazę pod kontekstową ocenę ryzyka, która zostanie wprowadzona w kolejnych wydaniach.
Wydajność i przewidywalność operacyjna
Pipeline detekcji został zoptymalizowany pod kątem czasu odpowiedzi i stabilności pod obciążeniem. Wprowadzono twardy budżet czasowy pojedynczej analizy, który eliminuje sytuacje przekazywania spóźnionych werdyktów do wywołań, których termin już minął. Domyślnie aktywne jest dynamiczne grupowanie zapytań, wcześniej niedostępne w części scenariuszy wdrożeniowych. Ograniczono również ilość danych przekazywanych w odpowiedziach systemu, co zmniejsza powierzchnię potencjalnego wycieku treści promptu w transporcie.
Po stronie analityki i rozliczeń liczniki w dashboardach przestały podwajać niektóre zdarzenia, a endpoint zużycia wykorzystywany przez warstwę billingową działa znacząco szybciej. Logowanie pod obciążeniem jest stabilne dzięki kontrolowanemu mechanizmowi backpressure, z dedykowaną metryką dostępną w warstwie monitoringu.
Po stronie wdrożeń aktualizacja jest atomowa. Procedury migracji bazy analitycznej rozróżniają operacje lekkie i ciężkie, co skraca okno utrzymaniowe podczas upgrade'u i ogranicza ryzyko niepotrzebnego rebuildu zasobów po stronie klienta.
Linia 1.6.x i linia 1.7.x: różnica charakteru
Linia 1.6.x rozszerzała Vigil Guard o nowe gałęzie detekcji, w tym Scope Drift oraz dwuprzejściową analizę długich promptów. Linia 1.7.x koncentruje się na jakości samej detekcji oraz na nowych powierzchniach, w których Vigil Guard działa w środowiskach agentowych.
| Aspekt | Linia 1.6.x | Linia 1.7.x |
|---|---|---|
| Główne zmiany | Scope Drift, dwuprzejściowa analiza długich promptów, kalibracja arbitra decyzji | Detektor vge-promptguard-v2h, integracja vge-cc-guard z Claude Code, rozszerzony kontrakt API |
| Charakter wydania | Nowe gałęzie detekcji | Wyższa jakość detekcji oraz nowe powierzchnie wejścia |
Dostępność
VigilGuard Enterprise 1.7.2 jest dostępny dla wszystkich klientów objętych aktywnym wsparciem. Aktualizacja jest zalecana w pierwszej kolejności w środowiskach, w których agenty pracują z wynikami narzędzi, w szczególności w zespołach korzystających z Claude Code.