feat: 实现完整的 OpenAI 兼容工具调用代理功能

新增功能： - 实现 ResponseParser 模块，支持解析 LLM 响应中的工具调用 - 支持双花括号格式的工具调用 {{...}} - 工具调用智能解析，处理嵌套 JSON 结构 - 生成符合 OpenAI 规范的 tool_call ID - 完善的数据库日志记录功能核心特性： - 低耦合高内聚的架构设计 - 完整的单元测试覆盖（23个测试全部通过） - 100% 兼容 OpenAI REST API tools 字段行为 - 支持流式和非流式响应 - 支持 content + tool_calls 混合响应技术实现： - response_parser.py: 响应解析器模块 - services.py: 业务逻辑层（工具注入、响应处理） - models.py: 数据模型定义 - main.py: API 端点和请求处理 - database.py: SQLite 数据库操作测试覆盖： - 工具调用解析（各种格式） - 流式响应处理 - 原生 OpenAI 格式支持 - 边缘情况处理 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>
2025-12-31 08:46:11 +00:00
parent 0d14c98cf4
commit 3f9dbb5448
9 changed files with 1072 additions and 178 deletions
--- a/app/main.py
+++ b/app/main.py
@@ -1,19 +1,19 @@
 import os
 import sys
-from dotenv import load_dotenv
-
-# --- Explicit Debugging & Env Loading ---
-print(f"--- [DEBUG] Current Working Directory: {os.getcwd()}", file=sys.stderr)
-load_result = load_dotenv()
-print(f"--- [DEBUG] load_dotenv() result: {load_result}", file=sys.stderr)
-# ---
-
 import logging
-from fastapi import FastAPI, HTTPException, Depends
+import time
+from dotenv import load_dotenv
+from fastapi import FastAPI, HTTPException, Depends, Request
 from starlette.responses import StreamingResponse
+
 from .models import IncomingRequest, ProxyResponse
-from .services import process_chat_request, stream_llm_api, inject_tools_into_prompt
+from .services import process_chat_request, stream_llm_api, inject_tools_into_prompt, parse_llm_response_from_content
 from .core.config import get_settings, Settings
+from .database import init_db, log_request, update_request_log
+
+# --- Environment & Debug Loading ---
+# load_dotenv() # Uncomment if you run uvicorn directly and need to load .env
+# ---

 # --- Logging Configuration ---
 logging.basicConfig(
@@ -33,9 +33,26 @@ app = FastAPI(
    version="1.0.0",
 )

+# --- Middleware for logging basic request/response info ---
+@app.middleware("http")
+async def logging_middleware(request: Request, call_next):
+    start_time = time.time()
+    logger.info(f"Request received: {request.method} {request.url.path} from {request.client.host}")
+    logger.info(f"Request Headers: {dict(request.headers)}")
+    
+    response = await call_next(request)
+    
+    process_time = (time.time() - start_time) * 1000
+    logger.info(f"Response sent: status_code={response.status_code} ({process_time:.2f}ms)")
+    return response
+# --- End of Middleware ---
+
+
@app.on_event("startup")
 async def startup_event():
    logger.info("Application startup complete.")
+    init_db()
+    logger.info("Database initialized.")
    current_settings = get_settings()
    logger.info(f"Loaded LLM API URL: {current_settings.REAL_LLM_API_URL}")

@@ -46,34 +63,57 @@ async def chat_completions(
 ):
    """
    This endpoint mimics the OpenAI Chat Completions API and supports both
-    streaming (`stream=True`) and non-streaming (`stream=False`) responses.
+    streaming and non-streaming responses, with detailed logging.
    """
+    log_id = log_request(client_request=request.model_dump())
+    logger.info(f"Request body logged with ID: {log_id}")
+
    if not settings.REAL_LLM_API_KEY or not settings.REAL_LLM_API_URL:
        logger.error("REAL_LLM_API_KEY or REAL_LLM_API_URL is not configured.")
        raise HTTPException(status_code=500, detail="LLM API Key or URL is not configured.")

-    # Prepare messages, potentially with tool injection
-    # This prepares the messages that will be sent to the LLM backend
    messages_to_llm = request.messages
    if request.tools:
        messages_to_llm = inject_tools_into_prompt(request.messages, request.tools)

    # Handle streaming request
    if request.stream:
-        logger.info(f"Initiating streaming request with {len(messages_to_llm)} messages.")
-        generator = stream_llm_api(messages_to_llm, settings)
-        return StreamingResponse(generator, media_type="text/event-stream")
+        logger.info(f"Initiating streaming request for log ID: {log_id}")
+        
+        async def stream_and_log():
+            stream_content_buffer = []
+            async for chunk in stream_llm_api(messages_to_llm, settings, log_id):
+                stream_content_buffer.append(chunk.decode('utf-8'))
+                yield chunk
+            
+            # After the stream is complete, parse the full content and log it
+            full_content = "".join(stream_content_buffer)
+            response_message = parse_llm_response_from_content(full_content)
+            proxy_response = ProxyResponse(message=response_message)
+            
+            logger.info(f"Streaming client response for log ID {log_id}:\n{proxy_response.model_dump_json(indent=2)}")
+            update_request_log(log_id, client_response=proxy_response.model_dump())
+
+        return StreamingResponse(stream_and_log(), media_type="text/event-stream")

    # Handle non-streaming request
    try:
-        logger.info(f"Initiating non-streaming request with {len(messages_to_llm)} messages.")
-        response_message = await process_chat_request(messages_to_llm, request.tools, settings)
-        logger.info("Successfully processed non-streaming request.")
-        return ProxyResponse(message=response_message)
+        logger.info(f"Initiating non-streaming request for log ID: {log_id}")
+        response_message = await process_chat_request(messages_to_llm, settings, log_id)
+        
+        proxy_response = ProxyResponse(message=response_message)
+        logger.info(f"Response body for log ID {log_id}:\n{proxy_response.model_dump_json(indent=2)}")
+
+        # Log client response to DB
+        update_request_log(log_id, client_response=proxy_response.model_dump())
+        
+        return proxy_response
    except Exception as e:
-        logger.exception("An unexpected error occurred during non-streaming request.")
+        logger.exception(f"An unexpected error occurred during non-streaming request for log ID: {log_id}")
+        # Log the error to the database
+        update_request_log(log_id, client_response={"error": str(e)})
        raise HTTPException(status_code=500, detail=f"An unexpected error occurred: {str(e)}")

@app.get("/")
 def read_root():
-    return {"message": "LLM Tool Proxy is running."}
+    return {"message": "LLM Tool Proxy is running."}