Subscription dashboard improvements, AI text generation limit, and other fixes.

2025-11-01 18:01:14 +05:30
parent cdb41aec1b
commit de4328175d
64 changed files with 5809 additions and 444 deletions
--- a/backend/services/llm_providers/main_text_generation.py
+++ b/backend/services/llm_providers/main_text_generation.py
@@ -7,6 +7,7 @@ migrated from the legacy lib/gpt_providers/text_generation/main_text_generation.
 import os
 import json
 from typing import Optional, Dict, Any
+from datetime import datetime
 from loguru import logger
 from ..onboarding.api_key_manager import APIKeyManager

@@ -14,7 +15,7 @@ from .gemini_provider import gemini_text_response, gemini_structured_json_respon
 from .huggingface_provider import huggingface_text_response, huggingface_structured_json_response


-def llm_text_gen(prompt: str, system_prompt: Optional[str] = None, json_struct: Optional[Dict[str, Any]] = None) -> str:
+def llm_text_gen(prompt: str, system_prompt: Optional[str] = None, json_struct: Optional[Dict[str, Any]] = None, user_id: str = None) -> str:
    """
    Generate text using Language Model (LLM) based on the provided prompt.
    
@@ -22,9 +23,13 @@ def llm_text_gen(prompt: str, system_prompt: Optional[str] = None, json_struct:
        prompt (str): The prompt to generate text from.
        system_prompt (str, optional): Custom system prompt to use instead of the default one.
        json_struct (dict, optional): JSON schema structure for structured responses.
+        user_id (str): Clerk user ID for subscription checking (required).
        
    Returns:
        str: Generated text based on the prompt.
+        
+    Raises:
+        RuntimeError: If subscription limits are exceeded or user_id is missing.
    """
    try:
        logger.info("[llm_text_gen] Starting text generation")
@@ -93,6 +98,75 @@ def llm_text_gen(prompt: str, system_prompt: Optional[str] = None, json_struct:
            
        logger.debug(f"[llm_text_gen] Using provider: {gpt_provider}, model: {model}")

+        # Map provider name to APIProvider enum (define at function scope for usage tracking)
+        from models.subscription_models import APIProvider
+        provider_enum = None
+        # Store actual provider name for logging (e.g., "huggingface", "gemini")
+        actual_provider_name = None
+        if gpt_provider == "google":
+            provider_enum = APIProvider.GEMINI
+            actual_provider_name = "gemini"  # Use "gemini" for consistency in logs
+        elif gpt_provider == "huggingface":
+            provider_enum = APIProvider.MISTRAL  # HuggingFace maps to Mistral enum for usage tracking
+            actual_provider_name = "huggingface"  # Keep actual provider name for logs
+        
+        if not provider_enum:
+            raise RuntimeError(f"Unknown provider {gpt_provider} for subscription checking")
+
+        # SUBSCRIPTION CHECK - Required and strict enforcement
+        if not user_id:
+            raise RuntimeError("user_id is required for subscription checking. Please provide Clerk user ID.")
+        
+        try:
+            from services.database import get_db
+            from services.subscription import UsageTrackingService, PricingService
+            from models.subscription_models import UsageSummary
+            
+            db = next(get_db())
+            try:
+                
+                usage_service = UsageTrackingService(db)
+                pricing_service = PricingService(db)
+                
+                # Estimate tokens from prompt (input tokens)
+                # Note: We estimate output tokens conservatively (assume response is similar length to prompt)
+                # This prevents underestimating total token usage
+                input_tokens = int(len(prompt.split()) * 1.3)
+                # Conservative estimate: assume output tokens ≈ input tokens * 1.0 (can be up to max_tokens)
+                estimated_output_tokens = min(input_tokens, max_tokens) if max_tokens else int(input_tokens * 0.8)
+                estimated_total_tokens = input_tokens + estimated_output_tokens
+                
+                # Check limits using sync method from pricing service (strict enforcement)
+                can_proceed, message, usage_info = pricing_service.check_usage_limits(
+                    user_id=user_id,
+                    provider=provider_enum,
+                    tokens_requested=estimated_total_tokens,
+                    actual_provider_name=actual_provider_name  # Pass actual provider name for correct error messages
+                )
+                
+                if not can_proceed:
+                    logger.warning(f"[llm_text_gen] Subscription limit exceeded for user {user_id}: {message}")
+                    raise RuntimeError(f"Subscription limit exceeded: {message}")
+                
+                # Get current usage for limit checking only
+                current_period = pricing_service.get_current_billing_period(user_id) or datetime.now().strftime("%Y-%m")
+                usage = db.query(UsageSummary).filter(
+                    UsageSummary.user_id == user_id,
+                    UsageSummary.billing_period == current_period
+                ).first()
+                
+                # No separate log here - we'll create unified log after API call and usage tracking
+                
+            finally:
+                db.close()
+        except RuntimeError:
+            # Re-raise subscription limit errors
+            raise
+        except Exception as sub_error:
+            # STRICT: Fail on subscription check errors
+            logger.error(f"[llm_text_gen] Subscription check failed for user {user_id}: {sub_error}")
+            raise RuntimeError(f"Subscription check failed: {str(sub_error)}")
+
        # Construct the system prompt if not provided
        if system_prompt is None:
            system_instructions = f"""You are a highly skilled content writer with a knack for creating engaging and informative content. 
@@ -117,10 +191,12 @@ def llm_text_gen(prompt: str, system_prompt: Optional[str] = None, json_struct:
            system_instructions = system_prompt

        # Generate response based on provider
+        response_text = None
+        actual_provider_used = gpt_provider
        try:
            if gpt_provider == "google":
                if json_struct:
-                    return gemini_structured_json_response(
+                    response_text = gemini_structured_json_response(
                        prompt=prompt,
                        schema=json_struct,
                        temperature=temperature,
@@ -130,7 +206,7 @@ def llm_text_gen(prompt: str, system_prompt: Optional[str] = None, json_struct:
                        system_prompt=system_instructions
                    )
                else:
-                    return gemini_text_response(
+                    response_text = gemini_text_response(
                        prompt=prompt,
                        temperature=temperature,
                        top_p=top_p,
@@ -140,7 +216,7 @@ def llm_text_gen(prompt: str, system_prompt: Optional[str] = None, json_struct:
                    )
            elif gpt_provider == "huggingface":
                if json_struct:
-                    return huggingface_structured_json_response(
+                    response_text = huggingface_structured_json_response(
                        prompt=prompt,
                        schema=json_struct,
                        model=model,
@@ -149,7 +225,7 @@ def llm_text_gen(prompt: str, system_prompt: Optional[str] = None, json_struct:
                        system_prompt=system_instructions
                    )
                else:
-                    return huggingface_text_response(
+                    response_text = huggingface_text_response(
                        prompt=prompt,
                        model=model,
                        temperature=temperature,
@@ -160,6 +236,107 @@ def llm_text_gen(prompt: str, system_prompt: Optional[str] = None, json_struct:
            else:
                logger.error(f"[llm_text_gen] Unknown provider: {gpt_provider}")
                raise RuntimeError("Unknown LLM provider. Supported providers: google, huggingface")
+            
+            # TRACK USAGE after successful API call
+            if response_text:
+                logger.info(f"[llm_text_gen] ✅ API call successful, tracking usage for user {user_id}, provider {provider_enum.value}")
+                try:
+                    db_track = next(get_db())
+                    try:
+                        # Estimate tokens from prompt and response
+                        tokens_input = estimated_tokens  # Already calculated above
+                        tokens_output = int(len(str(response_text).split()) * 1.3)  # Estimate output tokens
+                        tokens_total = tokens_input + tokens_output
+                        
+                        logger.debug(f"[llm_text_gen] Token estimates: input={tokens_input}, output={tokens_output}, total={tokens_total}")
+                        
+                        # Get or create usage summary
+                        from models.subscription_models import UsageSummary
+                        from services.subscription import PricingService
+                        
+                        pricing = PricingService(db_track)
+                        current_period = pricing.get_current_billing_period(user_id) or datetime.now().strftime("%Y-%m")
+                        
+                        logger.debug(f"[llm_text_gen] Looking for usage summary: user_id={user_id}, period={current_period}")
+                        
+                        summary = db_track.query(UsageSummary).filter(
+                            UsageSummary.user_id == user_id,
+                            UsageSummary.billing_period == current_period
+                        ).first()
+                        
+                        if not summary:
+                            logger.info(f"[llm_text_gen] Creating new usage summary for user {user_id}, period {current_period}")
+                            summary = UsageSummary(
+                                user_id=user_id,
+                                billing_period=current_period
+                            )
+                            db_track.add(summary)
+                            db_track.flush()  # Ensure summary is persisted before updating
+                        
+                        # Get "before" state for unified log
+                        provider_name = provider_enum.value
+                        current_calls_before = getattr(summary, f"{provider_name}_calls", 0) or 0
+                        
+                        # Update provider-specific counters (sync operation)
+                        new_calls = current_calls_before + 1
+                        setattr(summary, f"{provider_name}_calls", new_calls)
+                        logger.debug(f"[llm_text_gen] Updated {provider_name}_calls: {current_calls_before} -> {new_calls}")
+                        
+                        # Update token usage for LLM providers
+                        if provider_enum in [APIProvider.GEMINI, APIProvider.OPENAI, APIProvider.ANTHROPIC, APIProvider.MISTRAL]:
+                            current_tokens_before = getattr(summary, f"{provider_name}_tokens", 0) or 0
+                            new_tokens = current_tokens_before + tokens_total
+                            setattr(summary, f"{provider_name}_tokens", new_tokens)
+                            logger.debug(f"[llm_text_gen] Updated {provider_name}_tokens: {current_tokens_before} -> {new_tokens}")
+                        else:
+                            current_tokens_before = 0
+                            new_tokens = 0
+                        
+                        # Update totals
+                        old_total_calls = summary.total_calls or 0
+                        old_total_tokens = summary.total_tokens or 0
+                        summary.total_calls = old_total_calls + 1
+                        summary.total_tokens = old_total_tokens + tokens_total
+                        logger.debug(f"[llm_text_gen] Updated totals: calls {old_total_calls} -> {summary.total_calls}, tokens {old_total_tokens} -> {summary.total_tokens}")
+                        
+                        # Get plan details for unified log
+                        limits = pricing.get_user_limits(user_id)
+                        plan_name = limits.get('plan_name', 'unknown') if limits else 'unknown'
+                        tier = limits.get('tier', 'unknown') if limits else 'unknown'
+                        call_limit = limits['limits'].get(f"{provider_name}_calls", 0) if limits else 0
+                        token_limit = limits['limits'].get(f"{provider_name}_tokens", 0) if limits else 0
+                        
+                        # Get image stats for unified log
+                        current_images_before = getattr(summary, "stability_calls", 0) or 0
+                        image_limit = limits['limits'].get("stability_calls", 0) if limits else 0
+                        
+                        db_track.commit()
+                        logger.info(f"[llm_text_gen] ✅ Successfully tracked usage: user {user_id} -> provider {provider_name} -> {new_calls} calls, {new_tokens} tokens")
+                        
+                        # UNIFIED SUBSCRIPTION LOG - Shows before/after state in one message
+                        # Use actual_provider_name (e.g., "huggingface") instead of enum value (e.g., "mistral")
+                        # Include image stats in the log
+                        print(f"""
+[SUBSCRIPTION] LLM Text Generation
+├─ User: {user_id}
+├─ Plan: {plan_name} ({tier})
+├─ Provider: {actual_provider_name}
+├─ Model: {model}
+├─ Calls: {current_calls_before} → {new_calls} / {call_limit if call_limit > 0 else '∞'}
+├─ Tokens: {current_tokens_before} → {new_tokens} / {token_limit if token_limit > 0 else '∞'}
+├─ Images: {current_images_before} / {image_limit if image_limit > 0 else '∞'}
+└─ Status: ✅ Allowed & Tracked
+""")
+                    except Exception as track_error:
+                        logger.error(f"[llm_text_gen] ❌ Error tracking usage (non-blocking): {track_error}", exc_info=True)
+                        db_track.rollback()
+                    finally:
+                        db_track.close()
+                except Exception as usage_error:
+                    # Non-blocking: log error but don't fail the request
+                    logger.error(f"[llm_text_gen] ❌ Failed to track usage: {usage_error}", exc_info=True)
+            
+            return response_text
        except Exception as provider_error:
            logger.error(f"[llm_text_gen] Provider {gpt_provider} failed: {str(provider_error)}")
            
@@ -171,9 +348,21 @@ def llm_text_gen(prompt: str, system_prompt: Optional[str] = None, json_struct:
                fallback_provider = fallback_providers[0]  # Only try the first available
                try:
                    logger.info(f"[llm_text_gen] Trying SINGLE fallback provider: {fallback_provider}")
+                    actual_provider_used = fallback_provider
+                    
+                    # Update provider enum for fallback
+                    if fallback_provider == "google":
+                        provider_enum = APIProvider.GEMINI
+                        actual_provider_name = "gemini"
+                        fallback_model = "gemini-2.0-flash-lite"
+                    elif fallback_provider == "huggingface":
+                        provider_enum = APIProvider.MISTRAL
+                        actual_provider_name = "huggingface"
+                        fallback_model = "openai/gpt-oss-120b:groq"
+                    
                    if fallback_provider == "google":
                        if json_struct:
-                            return gemini_structured_json_response(
+                            response_text = gemini_structured_json_response(
                                prompt=prompt,
                                schema=json_struct,
                                temperature=temperature,
@@ -183,7 +372,7 @@ def llm_text_gen(prompt: str, system_prompt: Optional[str] = None, json_struct:
                                system_prompt=system_instructions
                            )
                        else:
-                            return gemini_text_response(
+                            response_text = gemini_text_response(
                                prompt=prompt,
                                temperature=temperature,
                                top_p=top_p,
@@ -193,7 +382,7 @@ def llm_text_gen(prompt: str, system_prompt: Optional[str] = None, json_struct:
                            )
                    elif fallback_provider == "huggingface":
                        if json_struct:
-                            return huggingface_structured_json_response(
+                            response_text = huggingface_structured_json_response(
                                prompt=prompt,
                                schema=json_struct,
                                model="openai/gpt-oss-120b:groq",
@@ -202,7 +391,7 @@ def llm_text_gen(prompt: str, system_prompt: Optional[str] = None, json_struct:
                                system_prompt=system_instructions
                            )
                        else:
-                            return huggingface_text_response(
+                            response_text = huggingface_text_response(
                                prompt=prompt,
                                model="openai/gpt-oss-120b:groq",
                                temperature=temperature,
@@ -210,6 +399,96 @@ def llm_text_gen(prompt: str, system_prompt: Optional[str] = None, json_struct:
                                top_p=top_p,
                                system_prompt=system_instructions
                            )
+                    
+                    # TRACK USAGE after successful fallback call
+                    if response_text:
+                        logger.info(f"[llm_text_gen] ✅ Fallback API call successful, tracking usage for user {user_id}, provider {provider_enum.value}")
+                        try:
+                            db_track = next(get_db())
+                            try:
+                                # Estimate tokens from prompt and response
+                                tokens_input = estimated_tokens
+                                tokens_output = int(len(str(response_text).split()) * 1.3)
+                                tokens_total = tokens_input + tokens_output
+                                
+                                # Get or create usage summary
+                                from models.subscription_models import UsageSummary
+                                from services.subscription import PricingService
+                                
+                                pricing = PricingService(db_track)
+                                current_period = pricing.get_current_billing_period(user_id) or datetime.now().strftime("%Y-%m")
+                                
+                                summary = db_track.query(UsageSummary).filter(
+                                    UsageSummary.user_id == user_id,
+                                    UsageSummary.billing_period == current_period
+                                ).first()
+                                
+                                if not summary:
+                                    summary = UsageSummary(
+                                        user_id=user_id,
+                                        billing_period=current_period
+                                    )
+                                    db_track.add(summary)
+                                    db_track.flush()  # Ensure summary is persisted before updating
+                                
+                                # Get "before" state for unified log
+                                provider_name = provider_enum.value
+                                current_calls_before = getattr(summary, f"{provider_name}_calls", 0) or 0
+                                
+                                # Update provider-specific counters (sync operation)
+                                new_calls = current_calls_before + 1
+                                setattr(summary, f"{provider_name}_calls", new_calls)
+                                
+                                # Update token usage for LLM providers
+                                if provider_enum in [APIProvider.GEMINI, APIProvider.OPENAI, APIProvider.ANTHROPIC, APIProvider.MISTRAL]:
+                                    current_tokens_before = getattr(summary, f"{provider_name}_tokens", 0) or 0
+                                    new_tokens = current_tokens_before + tokens_total
+                                    setattr(summary, f"{provider_name}_tokens", new_tokens)
+                                else:
+                                    current_tokens_before = 0
+                                    new_tokens = 0
+                                
+                                # Update totals
+                                summary.total_calls = (summary.total_calls or 0) + 1
+                                summary.total_tokens = (summary.total_tokens or 0) + tokens_total
+                                
+                                # Get plan details for unified log
+                                limits = pricing.get_user_limits(user_id)
+                                plan_name = limits.get('plan_name', 'unknown') if limits else 'unknown'
+                                tier = limits.get('tier', 'unknown') if limits else 'unknown'
+                                call_limit = limits['limits'].get(f"{provider_name}_calls", 0) if limits else 0
+                                token_limit = limits['limits'].get(f"{provider_name}_tokens", 0) if limits else 0
+                                
+                                # Get image stats for unified log
+                                current_images_before = getattr(summary, "stability_calls", 0) or 0
+                                image_limit = limits['limits'].get("stability_calls", 0) if limits else 0
+                                
+                                db_track.commit()
+                                logger.info(f"[llm_text_gen] ✅ Successfully tracked fallback usage: user {user_id} -> provider {provider_name} -> {new_calls} calls, {new_tokens} tokens")
+                                
+                                # UNIFIED SUBSCRIPTION LOG for fallback
+                                # Use actual_provider_name (e.g., "huggingface") instead of enum value (e.g., "mistral")
+                                # Include image stats in the log
+                                print(f"""
+[SUBSCRIPTION] LLM Text Generation (Fallback)
+├─ User: {user_id}
+├─ Plan: {plan_name} ({tier})
+├─ Provider: {actual_provider_name}
+├─ Model: {fallback_model}
+├─ Calls: {current_calls_before} → {new_calls} / {call_limit if call_limit > 0 else '∞'}
+├─ Tokens: {current_tokens_before} → {new_tokens} / {token_limit if token_limit > 0 else '∞'}
+├─ Images: {current_images_before} / {image_limit if image_limit > 0 else '∞'}
+└─ Status: ✅ Allowed & Tracked
+""")
+                            except Exception as track_error:
+                                logger.error(f"[llm_text_gen] ❌ Error tracking fallback usage (non-blocking): {track_error}", exc_info=True)
+                                db_track.rollback()
+                            finally:
+                                db_track.close()
+                        except Exception as usage_error:
+                            logger.error(f"[llm_text_gen] ❌ Failed to track fallback usage: {usage_error}", exc_info=True)
+                    
+                    return response_text
                except Exception as fallback_error:
                    logger.error(f"[llm_text_gen] Fallback provider {fallback_provider} also failed: {str(fallback_error)}")