feat: implement retry logic for service unavailable errors in AI content generation

2025-10-06 10:28:01 -05:00
parent 1e912be72c
commit 10e9cdd092
1 changed files with 89 additions and 2 deletions
--- a/src/core/services/AIService.ts
+++ b/src/core/services/AIService.ts
@@ -83,6 +83,46 @@ function isAPIError(error: unknown): error is { message: string; code?: string }
    );
 }
 const sleep = (ms: number): Promise<void> => new Promise(resolve => setTimeout(resolve, ms));
 function isServiceUnavailableError(error: unknown): boolean {
    if (!error) {
        return false;
    }
    const message = getErrorMessage(error).toLowerCase();
    if (
        message.includes('503') ||
        message.includes('service unavailable') ||
        message.includes('model is overloaded') ||
        message.includes('model estuvo sobrecargado') ||
        message.includes('overloaded') ||
        message.includes('temporarily unavailable')
    ) {
        return true;
    }
    const status = (error as any)?.status ?? (error as any)?.statusCode ?? (error as any)?.code;
    if (typeof status === 'number' && status === 503) {
        return true;
    }
    if (typeof status === 'string' && status.includes('503')) {
        return true;
    }
    if (isAPIError(error)) {
        const apiMessage = error.message.toLowerCase();
        return (
            apiMessage.includes('503') ||
            apiMessage.includes('service unavailable') ||
            apiMessage.includes('overloaded')
        );
    }
    return false;
 }
 export class AIService {
    private genAI: GoogleGenerativeAI;
    private genAIv2: any;
@@ -412,6 +452,9 @@ export class AIService {
            if (apiMessage.includes('quota') || apiMessage.includes('exceeded')) {
                return 'Se ha alcanzado el límite de uso de la API. Intenta más tarde';
            }
            if (apiMessage.includes('service unavailable') || apiMessage.includes('overloaded') || apiMessage.includes('503')) {
                return 'El servicio de IA está saturado. Intenta de nuevo en unos segundos';
            }
            if (apiMessage.includes('safety') || apiMessage.includes('blocked')) {
                return 'Tu mensaje fue bloqueado por las políticas de seguridad';
            }
@@ -433,6 +476,9 @@ export class AIService {
        if (message.includes('quota') || message.includes('exceeded')) {
            return 'Se ha alcanzado el límite de uso de la API. Intenta más tarde';
        }
        if (message.includes('service unavailable') || message.includes('overloaded') || message.includes('503')) {
            return 'El servicio de IA está saturado. Intenta de nuevo en unos segundos';
        }
        if (message.includes('safety') || message.includes('blocked')) {
            return 'Tu mensaje fue bloqueado por las políticas de seguridad';
        }
@@ -449,6 +495,47 @@ export class AIService {
        return 'Error temporal del servicio de IA. Intenta de nuevo';
    }
    private async generateContentWithRetries(model: any, content: any, options?: {
        maxAttempts?: number;
        baseDelayMs?: number;
        maxDelayMs?: number;
    }): Promise<any> {
        const {
            maxAttempts = 3,
            baseDelayMs = 1200,
            maxDelayMs = 10_000
        } = options ?? {};
        let lastError: unknown;
        for (let attempt = 0; attempt < maxAttempts; attempt++) {
            try {
                return await model.generateContent(content);
            } catch (error) {
                lastError = error;
                const isRetryable = isServiceUnavailableError(error);
                const isLastAttempt = attempt === maxAttempts - 1;
                if (!isRetryable || isLastAttempt) {
                    throw error;
                }
                const backoff = Math.min(maxDelayMs, Math.floor(baseDelayMs * Math.pow(2, attempt)));
                const jitter = Math.floor(Math.random() * Math.max(200, Math.floor(baseDelayMs / 2)));
                const waitMs = backoff + jitter;
                logger.warn(
                    { attempt: attempt + 1, waitMs },
                    `Gemini respondió 503 (overloaded). Reintentando en ${waitMs}ms (intento ${attempt + 2}/${maxAttempts})`
                );
                await sleep(waitMs);
            }
        }
        throw lastError ?? new Error('Error desconocido al generar contenido con Gemini');
    }
    /**
     * Procesa una request de IA con soporte para conversaciones y memoria persistente
     */
@@ -696,7 +783,7 @@ export class AIService {
            // Usar gemini-2.5-flash-preview-09-2025 que puede leer imágenes y responder con texto
            const model = this.genAI.getGenerativeModel({
-                model: "gemini-2.5-flash-preview-09-2025",
+                model: "gemini-2.5-flash",
                generationConfig: {
                    maxOutputTokens: Math.min(this.config.maxOutputTokens, Math.max(1024, estimatedTokens * 0.5)),
                    temperature: 0.7,
@@ -729,7 +816,7 @@ export class AIService {
                content = systemPrompt;
            }
-            const result = await model.generateContent(content);
+            const result = await this.generateContentWithRetries(model, content);
            const response = await result.response;
            const aiResponse = response.text()?.trim();