Spaces:

ka1kuk
/

LLM-api

Sleeping

ka1kuk commited on Mar 12

Commit

ed63ae6

•

1 Parent(s): 8ef9b69

Update apis/chat_api.py

Files changed (1) hide show

apis/chat_api.py CHANGED Viewed

@@ -187,26 +187,26 @@ class ChatAPIApp:
             return data_response
     async def embedding(request: QueryRequest):
-    try:
-        for attempt in range(3):  # Retry logic
-            try:
-                embeddings = await send_request_to_hugging_face(request.texts, request.model_name, request.api_key)
-                data = [
-                    {"object": "embedding", "index": i, "embedding": embedding}
-                    for i, embedding in enumerate(embeddings)
-                ]
-                return {
-                    "object": "list",
-                    "data": data,
-                    "model": request.model_name,
-                    "usage": {"prompt_tokens": len(request.texts), "total_tokens": len(request.texts)}
-                }
-            except RuntimeError as e:
-                if attempt < 2:  # Don't sleep on the last attempt
-                    await asyncio.sleep(10)  # Delay for the retry
-        raise HTTPException(status_code=503, detail="The model is currently loading, please try again later.")
-    except Exception as e:
-        raise HTTPException(status_code=500, detail=str(e))
     def setup_routes(self):
         for prefix in ["", "/v1", "/api", "/api/v1"]:

             return data_response
     async def embedding(request: QueryRequest):
+        try:
+            for attempt in range(3):  # Retry logic
+                try:
+                    embeddings = await send_request_to_hugging_face(request.texts, request.model_name, request.api_key)
+                    data = [
+                        {"object": "embedding", "index": i, "embedding": embedding}
+                        for i, embedding in enumerate(embeddings)
+                    ]
+                    return {
+                        "object": "list",
+                        "data": data,
+                        "model": request.model_name,
+                        "usage": {"prompt_tokens": len(request.texts), "total_tokens": len(request.texts)}
+                    }
+                except RuntimeError as e:
+                    if attempt < 2:  # Don't sleep on the last attempt
+                        await asyncio.sleep(10)  # Delay for the retry
+            raise HTTPException(status_code=503, detail="The model is currently loading, please try again later.")
+        except Exception as e:
+            raise HTTPException(status_code=500, detail=str(e))
     def setup_routes(self):
         for prefix in ["", "/v1", "/api", "/api/v1"]: