Enrich Laminar data (#3650)

2025-10-08 14:58:50 -07:00
parent f8e76162d0
commit 89931b50ca
7 changed files with 206 additions and 0 deletions
--- a/skyvern/forge/agent.py
+++ b/skyvern/forge/agent.py
@@ -83,6 +83,7 @@ from skyvern.forge.sdk.schemas.files import FileInfo
 from skyvern.forge.sdk.schemas.organizations import Organization
 from skyvern.forge.sdk.schemas.tasks import Task, TaskRequest, TaskResponse, TaskStatus
 from skyvern.forge.sdk.trace import TraceManager
+from skyvern.forge.sdk.trace.experiment_utils import collect_experiment_metadata_safely
 from skyvern.forge.sdk.workflow.context_manager import WorkflowRunContext
 from skyvern.forge.sdk.workflow.models.block import ActionBlock, BaseTaskBlock, ValidationBlock
 from skyvern.forge.sdk.workflow.models.workflow import Workflow, WorkflowRun, WorkflowRunStatus
@@ -312,6 +313,11 @@ class ForgeAgent:
            close_browser_on_completion and browser_session_id is None and not task.browser_address
        )

+        # Collect and add experiment metadata to the trace
+        experiment_metadata = await collect_experiment_metadata_safely(app.EXPERIMENTATION_PROVIDER)
+        if experiment_metadata:
+            TraceManager.add_experiment_metadata(experiment_metadata)
+
        workflow_run: WorkflowRun | None = None
        if task.workflow_run_id:
            workflow_run = await app.DATABASE.get_workflow_run(
@@ -2471,6 +2477,9 @@ class ForgeAgent:

        # log the task status as an event
        analytics.capture("skyvern-oss-agent-task-status", {"status": task.status})
+
+        # Add task completion tag to Laminar trace
+        TraceManager.add_task_completion_tag(task.status.value)
        if need_final_screenshot:
            # Take one last screenshot and create an artifact before closing the browser to see the final state
            # We don't need the artifacts and send the webhook response directly only when there is an issue with the browser
--- a/skyvern/forge/sdk/trace/init.py
+++ b/skyvern/forge/sdk/trace/init.py
@@ -90,3 +90,13 @@ class TraceManager:
    @staticmethod
    def set_trace_provider(trace_provider: BaseTrace) -> None:
        TraceManager.__instance = trace_provider
+
+    @staticmethod
+    def add_task_completion_tag(status: str) -> None:
+        """Add a completion tag to the current trace based on task/workflow status."""
+        TraceManager.__instance.add_task_completion_tag(status)
+
+    @staticmethod
+    def add_experiment_metadata(experiment_data: dict[str, Any]) -> None:
+        """Add experiment metadata to the current trace."""
+        TraceManager.__instance.add_experiment_metadata(experiment_data)
--- a/skyvern/forge/sdk/trace/base.py
+++ b/skyvern/forge/sdk/trace/base.py
@@ -26,6 +26,12 @@ class BaseTrace(ABC):
    ) -> Callable[[Callable[P, Awaitable[R]]], Callable[P, Awaitable[R]]]:
        pass

+    def add_task_completion_tag(self, status: str) -> None:
+        """Add a completion tag to the current trace based on task/workflow status."""
+
+    def add_experiment_metadata(self, experiment_data: dict[str, Any]) -> None:
+        """Add experiment metadata to the current trace."""
+

 class NoOpTrace(BaseTrace):
    def traced(
--- a/skyvern/forge/sdk/trace/experiment_utils.py
+++ b/skyvern/forge/sdk/trace/experiment_utils.py
@@ -0,0 +1,97 @@
+"""Utilities for collecting and formatting experiment data for Laminar tracing."""
+
+from typing import TYPE_CHECKING, Any
+
+import structlog
+
+from skyvern.forge.sdk.core import skyvern_context
+
+if TYPE_CHECKING:
+    from skyvern.forge.sdk.experimentation.providers import BaseExperimentationProvider
+
+LOG = structlog.get_logger()
+
+
+async def collect_experiment_metadata_safely(
+    experimentation_provider: "BaseExperimentationProvider",
+) -> dict[str, Any]:
+    """
+    Safely collect experiment-related metadata from the current context.
+
+    This is a safe wrapper around collect_experiment_metadata() that ensures
+    any exceptions are caught and handled gracefully.
+
+    Args:
+        experimentation_provider: The experimentation provider to use for fetching experiment data.
+
+    Returns:
+        Dictionary containing experiment data, or empty dict if collection fails.
+    """
+    try:
+        return await collect_experiment_metadata(experimentation_provider)
+    except Exception:
+        LOG.warning("Failed to collect experiment metadata", exc_info=True)
+        return {}
+
+
+async def collect_experiment_metadata(
+    experimentation_provider: "BaseExperimentationProvider",
+) -> dict[str, Any]:
+    """
+    Collect experiment-related metadata from the current context.
+
+    Args:
+        experimentation_provider: The experimentation provider to use for fetching experiment data.
+
+    Returns:
+        Dictionary containing experiment data that can be added to Laminar traces.
+    """
+    # Get the current context
+    context = skyvern_context.current()
+    if not context or not context.run_id:
+        return {}
+
+    # Use run_id as the distinct_id for experiments
+    distinct_id = context.run_id
+    organization_id = context.organization_id
+
+    if not distinct_id or not organization_id:
+        return {}
+
+    experiment_metadata: dict[str, Any] = {}
+
+    try:
+        # Only collect critical experiment flags that are relevant for tracing
+        experiment_flags = [
+            "LLM_NAME",
+            "LLM_SECONDARY_NAME",
+            # Add more experiment flags as needed
+            "PROMPT_CACHING_ENABLED",
+            "THINKING_BUDGET_OPTIMIZATION",
+        ]
+
+        for flag in experiment_flags:
+            try:
+                # Get the experiment value (already cached by experimentation provider)
+                value = experimentation_provider.get_value_cached(
+                    flag, distinct_id, properties={"organization_id": organization_id}
+                )
+
+                # Get the payload if available (already cached by experimentation provider)
+                payload = experimentation_provider.get_payload_cached(
+                    flag, distinct_id, properties={"organization_id": organization_id}
+                )
+
+                # Only include if we have actual experiment data
+                if value is not None or payload is not None:
+                    experiment_metadata[f"experiment_{flag}"] = {"value": value, "payload": payload}
+
+            except Exception:
+                # Silently skip failed experiments
+                continue
+
+    except Exception:
+        # Silently fail if experimentation provider is not available
+        pass
+
+    return experiment_metadata
--- a/skyvern/forge/sdk/trace/lmnr.py
+++ b/skyvern/forge/sdk/trace/lmnr.py
@@ -31,3 +31,35 @@ class LaminarTrace(BaseTrace):
        **kwargs: Any,
    ) -> Callable[[Callable[P, Awaitable[R]]], Callable[P, Awaitable[R]]]:
        return observe(name=name, ignore_output=True, metadata=metadata, tags=tags, **kwargs)
+
+    def add_task_completion_tag(self, status: str) -> None:
+        """Add a completion tag to the current trace based on task/workflow status."""
+        try:
+            # Get the current trace ID
+            trace_id = Laminar.get_trace_id()
+            if trace_id is None:
+                return
+
+            # Map status to appropriate tag
+            status_tag_map = {
+                "completed": "COMPLETION",
+                "failed": "FAILURE",
+                "timed_out": "TIMEOUT",
+                "canceled": "CANCELED",
+                "terminated": "TERMINATED",
+            }
+
+            tag = status_tag_map.get(status, "FAILURE")
+            Laminar.set_span_tags([tag])
+        except Exception:
+            # Silently fail if tracing is not available or there's an error
+            pass
+
+    def add_experiment_metadata(self, experiment_data: dict[str, Any]) -> None:
+        """Add experiment metadata to the current trace."""
+        try:
+            # Add experiment metadata to the current trace
+            Laminar.set_trace_metadata(experiment_data)
+        except Exception:
+            # Silently fail if tracing is not available or there's an error
+            pass
--- a/skyvern/forge/sdk/workflow/service.py
+++ b/skyvern/forge/sdk/workflow/service.py
@@ -38,6 +38,7 @@ from skyvern.forge.sdk.schemas.organizations import Organization
 from skyvern.forge.sdk.schemas.tasks import Task
 from skyvern.forge.sdk.schemas.workflow_runs import WorkflowRunBlock, WorkflowRunTimeline, WorkflowRunTimelineType
 from skyvern.forge.sdk.trace import TraceManager
+from skyvern.forge.sdk.trace.experiment_utils import collect_experiment_metadata_safely
 from skyvern.forge.sdk.workflow.exceptions import (
    ContextParameterSourceNotDefined,
    InvalidWaitBlockTime,
@@ -339,6 +340,12 @@ class WorkflowService:
    ) -> WorkflowRun:
        """Execute a workflow."""
        organization_id = organization.organization_id
+
+        # Collect and add experiment metadata to the trace
+        experiment_metadata = await collect_experiment_metadata_safely(app.EXPERIMENTATION_PROVIDER)
+        if experiment_metadata:
+            TraceManager.add_experiment_metadata(experiment_metadata)
+
        LOG.info(
            "Executing workflow",
            workflow_run_id=workflow_run_id,
@@ -1147,6 +1154,10 @@ class WorkflowService:
            workflow_run_id=workflow_run_id,
            workflow_status="completed",
        )
+
+        # Add workflow completion tag to Laminar trace
+        TraceManager.add_task_completion_tag(WorkflowRunStatus.completed)
+
        return await self._update_workflow_run_status(
            workflow_run_id=workflow_run_id,
            status=WorkflowRunStatus.completed,
@@ -1165,6 +1176,10 @@ class WorkflowService:
            workflow_status="failed",
            failure_reason=failure_reason,
        )
+
+        # Add workflow failure tag to Laminar trace
+        TraceManager.add_task_completion_tag(WorkflowRunStatus.failed)
+
        return await self._update_workflow_run_status(
            workflow_run_id=workflow_run_id,
            status=WorkflowRunStatus.failed,
@@ -1197,6 +1212,10 @@ class WorkflowService:
            workflow_status="terminated",
            failure_reason=failure_reason,
        )
+
+        # Add workflow terminated tag to Laminar trace
+        TraceManager.add_task_completion_tag(WorkflowRunStatus.terminated)
+
        return await self._update_workflow_run_status(
            workflow_run_id=workflow_run_id,
            status=WorkflowRunStatus.terminated,
@@ -1210,6 +1229,10 @@ class WorkflowService:
            workflow_run_id=workflow_run_id,
            workflow_status="canceled",
        )
+
+        # Add workflow canceled tag to Laminar trace
+        TraceManager.add_task_completion_tag(WorkflowRunStatus.canceled)
+
        return await self._update_workflow_run_status(
            workflow_run_id=workflow_run_id,
            status=WorkflowRunStatus.canceled,
@@ -1227,6 +1250,10 @@ class WorkflowService:
            workflow_run_id=workflow_run_id,
            workflow_status="timed_out",
        )
+
+        # Add workflow timed out tag to Laminar trace
+        TraceManager.add_task_completion_tag(WorkflowRunStatus.timed_out)
+
        return await self._update_workflow_run_status(
            workflow_run_id=workflow_run_id,
            status=WorkflowRunStatus.timed_out,