PrimeIntellect-ai · hubert-marek · Jun 10, 2026 · macroscopeapp · Jun 10, 2026 · chatgpt-codex-connector
diff --git a/verifiers/serve/server/env_worker.py b/verifiers/serve/server/env_worker.py
@@ -248,9 +248,18 @@ async def send_error_response(error: str) -> None:
 
     async def stats_loop(self, interval: float = 10.0) -> None:
         """Loop to push worker stats to the router."""
+        try:
+            import ctypes
+
+            libc = ctypes.CDLL("libc.so.6")
+        except OSError:
+            libc = None
         while True:
             await asyncio.sleep(interval)
 
+            if libc is not None:
+                libc.malloc_trim(0)
+
             stats = EnvWorkerStats(
                 worker_id=self.worker_id,
                 timestamp=time.time(),

diff --git a/verifiers/v1/runtime.py b/verifiers/v1/runtime.py
@@ -1052,6 +1052,7 @@ async def cleanup_rollout(self, task: Task, state: State) -> None:
         key = str(state["trajectory_id"])
         self._model_request_locks.pop(key, None)
         self._inflight_visible_model_requests.pop(key, None)
+        self.trajectories.pop(key, None)
         self.release_tool_handles(state)
 
     async def cleanup_group(self, tasks: list[Task], states: list[State]) -> None:

diff --git a/verifiers/v1/utils/endpoint_utils.py b/verifiers/v1/utils/endpoint_utils.py
@@ -240,6 +240,10 @@ def rollout_queue(self, rollout_key: str) -> asyncio.Queue[str]:
     def get_request(self, request_id: str) -> EndpointInterceptData:
         return cast(EndpointInterceptData, self.server.intercepts[request_id])
 
+    def discard_request(self, request_id: str) -> None:
+        """Drop a delivered intercept from the server's per-request store."""
+        self.server.intercepts.pop(request_id, None)
+
     def request_context(
         self, request_id: str, request: EndpointInterceptData
     ) -> ModelRequestContext:
@@ -513,14 +517,17 @@ async def forward_request(
             state._set_error(e)
         raise
     finally:
-        if bool(request.get("stream")):
-            if request.get("protocol") != "openai_chat_completions":
-                raise NotImplementedError(
-                    "Streaming interception is currently supported for OpenAI Chat Completions."
-                )
-            await synthesize_stream(request, response, error)
-        else:
-            deliver_response(request, response, error)
+        try:
+            if bool(request.get("stream")):
+                if request.get("protocol") != "openai_chat_completions":
+                    raise NotImplementedError(
+                        "Streaming interception is currently supported for OpenAI Chat Completions."
+                    )
+                await synthesize_stream(request, response, error)
+            else:
+                deliver_response(request, response, error)
+        finally:
+            endpoint.discard_request(request_id)
 
 
 def normalize_endpoint_prompt(request: EndpointInterceptData) -> Messages: