limit batching to 100 in openai embeddings

2025-05-09 19:32:38 +00:00 · 2025-05-02 20:20:49 -07:00 · 2025-05-02 20:20:49 -07:00 · ae5297e5dc
commit ae5297e5dc
parent 934b3ce666
1 changed files with 9 additions and 1 deletions
--- a/core/embedding/litellm_embedding.py
+++ b/core/embedding/litellm_embedding.py
@ -108,7 +108,15 @@ class LiteLLMEmbeddingModel(BaseEmbeddingModel):
            chunks = [chunks]

        texts = [chunk.content for chunk in chunks]
-        return await self.embed_documents(texts)
+        # Batch embedding to respect token limits
+        settings = get_settings()
+        batch_size = getattr(settings, "EMBEDDING_BATCH_SIZE", 100)
+        embeddings: List[List[float]] = []
+        for i in range(0, len(texts), batch_size):
+            batch_texts = texts[i : i + batch_size]
+            batch_embeddings = await self.embed_documents(batch_texts)
+            embeddings.extend(batch_embeddings)
+        return embeddings

    async def embed_for_query(self, text: str) -> List[float]:
        """