catch litellm no deployment error (token ratelimit / ValueError) and raise LLMProviderErrorRetryableTask (#758)

2024-08-29 12:19:51 -07:00
parent 6f61573f9b
commit 06daa9834f
1 changed files with 7 additions and 0 deletions
--- a/skyvern/forge/sdk/api/llm/api_handler_factory.py
+++ b/skyvern/forge/sdk/api/llm/api_handler_factory.py
@@ -108,6 +108,13 @@ class LLMAPIHandlerFactory:
                LOG.info("LLM API call successful", llm_key=llm_key, model=llm_config.model_name)
            except litellm.exceptions.APIError as e:
                raise LLMProviderErrorRetryableTask(llm_key) from e
+            except ValueError as e:
+                LOG.exception(
+                    "LLM token limit exceeded",
+                    llm_key=llm_key,
+                    model=main_model_group,
+                )
+                raise LLMProviderErrorRetryableTask(llm_key) from e
            except Exception as e:
                LOG.exception(
                    "LLM request failed unexpectedly",