feat: :adhesive_bandage: QueuedLLM for simultaneous reqs (LM Studio)

author: Nate Sesti <sestinj@gmail.com> 2023-09-06 21:17:10 -0700
committer: Nate Sesti <sestinj@gmail.com> 2023-09-06 21:17:10 -0700
commit: e9d289173ec28a1a90ae58b1834c476bb46834b8 (patch)
tree: 2d5bf2ccac6131d5da962aa8932a2020b02c0208 /continuedev/src
parent: 568771d9b94280f1cb47aae863e8faf168eb052b (diff)
download: sncontinue-e9d289173ec28a1a90ae58b1834c476bb46834b8.tar.gz
sncontinue-e9d289173ec28a1a90ae58b1834c476bb46834b8.tar.bz2
sncontinue-e9d289173ec28a1a90ae58b1834c476bb46834b8.zip
2 files changed, 56 insertions, 1 deletions
diff --git a/continuedev/src/continuedev/libs/llm/maybe_proxy_openai.py b/continuedev/src/continuedev/libs/llm/maybe_proxy_openai.py
index 084c57fd..07e27349 100644
--- a/continuedev/src/continuedev/libs/llm/maybe_proxy_openai.py
+++ b/continuedev/src/continuedev/libs/llm/maybe_proxy_openai.py
@@ -18,7 +18,7 @@ class MaybeProxyOpenAI(LLM):
     async def start(
         self, write_log: Callable[[str], None] = None, unique_id: Optional[str] = None
     ):
-        await super().start(write_log=lambda *args, **kwargs: None, unique_id=unique_id)
+        await super().start(write_log=write_log, unique_id=unique_id)
         if self.api_key is None or self.api_key.strip() == "":
             self.llm = ProxyServer(model=self.model)
         else:
diff --git a/continuedev/src/continuedev/libs/llm/queued.py b/continuedev/src/continuedev/libs/llm/queued.py
new file mode 100644
index 00000000..9e6e0180
--- /dev/null
+++ b/continuedev/src/continuedev/libs/llm/queued.py
@@ -0,0 +1,55 @@
+import asyncio
+from typing import Any, List
+
+from ...core.main import ChatMessage
+from . import LLM, CompletionOptions
+
+
+class QueuedLLM(LLM):
+    llm: LLM
+    _lock: asyncio.Lock
+
+    model: str = "queued"
+
+    def dict(self, **kwargs):
+        return self.llm.dict(**kwargs)
+
+    async def start(self, *args, **kwargs):
+        await super().start(*args, **kwargs)
+        await self.llm.start(*args, **kwargs)
+        self._lock = asyncio.Lock()
+        self.model = self.llm.model
+
+    async def stop(self):
+        await self.llm.stop()
+
+    def collect_args(self, options: CompletionOptions):
+        return self.llm.collect_args(options)
+
+    def compile_chat_messages(
+        self,
+        options: CompletionOptions,
+        msgs: List[ChatMessage],
+        functions: List[Any] | None = None,
+    ):
+        return self.llm.compile_chat_messages(options, msgs, functions)
+
+    def template_prompt_like_messages(self, prompt: str) -> str:
+        return self.llm.template_prompt_like_messages(prompt)
+
+    async def _complete(self, prompt: str, options: CompletionOptions):
+        async with self._lock:
+            resp = await self.llm._complete(prompt, options)
+            return resp
+
+    async def _stream_complete(self, prompt: str, options: CompletionOptions):
+        async with self._lock:
+            async for chunk in self.llm._stream_complete(prompt, options):
+                yield chunk
+
+    async def _stream_chat(
+        self, messages: List[ChatMessage], options: CompletionOptions
+    ):
+        async with self._lock:
+            async for chunk in self.llm._stream_chat(messages, options):
+                yield chunk
author	Nate Sesti <sestinj@gmail.com>	2023-09-06 21:17:10 -0700
committer	Nate Sesti <sestinj@gmail.com>	2023-09-06 21:17:10 -0700
commit	e9d289173ec28a1a90ae58b1834c476bb46834b8 (patch)
tree	2d5bf2ccac6131d5da962aa8932a2020b02c0208 /continuedev/src
parent	568771d9b94280f1cb47aae863e8faf168eb052b (diff)
download	sncontinue-e9d289173ec28a1a90ae58b1834c476bb46834b8.tar.gz sncontinue-e9d289173ec28a1a90ae58b1834c476bb46834b8.tar.bz2 sncontinue-e9d289173ec28a1a90ae58b1834c476bb46834b8.zip