feat: ContentGuardianAgent, onboarding UX, Team Activity action wiring, docs, agent help modal

ContentGuardianAgent consolidation: - Merge 3 duplicate classes into single source in specialized/content_guardian.py - Watchdog audit_committee() with heuristic scoring, coverage gaps, overlaps, alerts - Remove misleading rejection_rate() helper; use acceptance_rate directly - Integrate audit + alerts + trend signals into today_workflow_service.py Team Activity page: - QualityAuditPanel: health ring, per-agent critiques, coverage gaps, overlaps - TrendSignalsPanel: opportunity cards with urgency/impact/coverage bars - AlertBanner: persistent dismiss via POST /alerts/{id}/mark-read - AgentHelpModal: dialog showing all 8 agents with descriptions, tools, schedule - QualityAuditPanel action buttons: Fill gap -> /content-planning, Resolve overlap, View CTA on alerts/issues - TrendSignalsPanel action buttons: Create content from this trend -> /blog-writer with trend context state Onboarding system: - Step 4 validation: no auto-pass via basic_ready; requires persona data or explicit progression - Step 5 validation: logs warning on auto-pass without integration data - OnboardingCompletionService: single DB session, transactional task creation, upsert pattern - Business-without-website: nullable website_url on SIFIndexingTask and MarketTrendsTask - DeepCompetitorAnalysisExecutor: 5-min timeout, 10-competitor cap, asyncio.wait_for - Persona generation: async with 30s timeout, falls back to scheduler - OnboardingProgressService.reset_onboarding(): resets session + pauses all DB tasks - OnboardingControlService.reset_onboarding(): also cancels APScheduler jobs - FinalStep TaskSchedulingPanel: shows scheduled/failed tasks after completion, 8s auto-redirect - onboarding_completed agent activity event logged to feed Documentation: - docs-site/features/onboarding/: overview, steps, scheduler-tasks, technical-reference (4 pages) - docs-site/mkdocs.yml: added Onboarding System nav section - docs-site/features/sif-agents/: overview, agent-directory, committee-system, content-guardian (4 pages) - docs-site/features/team-activity/: overview, quality-audit, trend-signals, alert-system (4 pages) - docs-site/features/todays-workflow/: updated overview, technical-architecture, workflow-guide, api-reference
2026-06-01 12:24:31 +05:30
parent 9b472f1c18
commit 923fa671fe
90 changed files with 8914 additions and 2731 deletions
--- a/backend/api/seo_dashboard.py
+++ b/backend/api/seo_dashboard.py
@@ -19,7 +19,7 @@ from services.seo import SEODashboardService
 from middleware.auth_middleware import get_current_user
 from services.llm_providers.main_text_generation import llm_text_gen
 from api.content_planning.services.content_strategy.onboarding import OnboardingDataIntegrationService
-from models.onboarding import SEOPageAudit, WebsiteAnalysis, OnboardingSession
+from models.onboarding import SEOPageAudit, WebsiteAnalysis, OnboardingSession, CompetitorAnalysis
 from sqlalchemy.orm.attributes import flag_modified

 from sqlalchemy import desc
@@ -752,6 +752,391 @@ async def get_keyword_gaps(
        raise HTTPException(status_code=500, detail=f"Failed to get keyword gaps: {str(e)}")


+async def get_serp_gaps(
+    current_user: dict = Depends(get_current_user),
+    topics: Optional[List[str]] = None,
+) -> Dict[str, Any]:
+    """
+    Get SERP gap analysis — detect which competitors rank for given topics.
+
+    Uses Google Custom Search `site:` queries per competitor domain to detect
+    ranking presence. Topics can be provided explicitly or derived from the
+    user's latest SIF semantic gap analysis.
+
+    Args:
+        topics: Optional list of topic phrases. If omitted, uses the user's
+                latest SIF semantic gaps (up to 12 topics).
+
+    Returns:
+        Dict with gaps list and metadata.
+    """
+    try:
+        user_id = str(current_user.get("id"))
+
+        # If no topics provided, fetch from SIF semantic gaps
+        if not topics:
+            try:
+                from services.intelligence.agents.specialized import StrategyArchitectAgent
+                from services.intelligence.txtai_service import TxtaiIntelligenceService
+
+                integration = OnboardingDataIntegrationService()
+                db_session = get_session_for_user(user_id)
+                if db_session:
+                    try:
+                        integrated = integration.get_integrated_data_sync(
+                            user_id, db_session
+                        )
+                        competitor_indices = []
+                        if integrated and integrated.get("competitor_analysis"):
+                            competitor_indices = [
+                                i
+                                for i, _ in enumerate(
+                                    integrated["competitor_analysis"]
+                                )
+                            ]
+                        agent = StrategyArchitectAgent(
+                            TxtaiIntelligenceService(user_id), user_id
+                        )
+                        gaps = await agent.find_semantic_gaps(competitor_indices)
+                        topics = [g["topic"] for g in gaps[:12]]
+                    finally:
+                        db_session.close()
+            except Exception as e:
+                logger.warning(
+                    f"Could not derive topics from SIF gaps: {e}. "
+                    "Pass topics explicitly."
+                )
+                return {
+                    "gaps": [],
+                    "message": "No topics provided and unable to derive from SIF gaps.",
+                }
+
+        if not topics:
+            return {
+                "gaps": [],
+                "message": "No topics to analyze. Complete onboarding and SIF indexing first.",
+            }
+
+        # Get competitor domains from onboarding
+        competitor_domains = []
+        db_session = get_session_for_user(user_id)
+        if db_session:
+            try:
+                analyses = (
+                    db_session.query(CompetitorAnalysis)
+                    .join(
+                        OnboardingSession,
+                        CompetitorAnalysis.session_id == OnboardingSession.id,
+                    )
+                    .filter(OnboardingSession.user_id == user_id)
+                    .filter(CompetitorAnalysis.competitor_domain.isnot(None))
+                    .all()
+                )
+                competitor_domains = list(
+                    set(a.competitor_domain for a in analyses if a.competitor_domain)
+                )
+            finally:
+                db_session.close()
+
+        if not competitor_domains:
+            return {
+                "gaps": [],
+                "message": "No competitor domains found. Complete onboarding Step 3.",
+            }
+
+        # Run SERP gap analysis
+        from services.seo_tools.serp_gap_service import SerpGapService
+
+        service = SerpGapService()
+        result = await service.analyze_topic_gaps(topics, competitor_domains)
+        return result
+
+    except Exception as e:
+        logger.error(f"Failed to get SERP gaps: {e}")
+        raise HTTPException(
+            status_code=500, detail=f"Failed to get SERP gaps: {str(e)}"
+        )
+
+
+async def get_competitor_content(
+    current_user: dict = Depends(get_current_user),
+    topics: Optional[List[str]] = None,
+) -> Dict[str, Any]:
+    """
+    Get competitor content deep-dive for gap topics using Exa.
+
+    Scopes Exa neural search to known competitor domains (from onboarding Step 3)
+    and returns full text, highlights, and summaries for competitive analysis.
+
+    Args:
+        topics: Optional list of topic phrases. If omitted, uses the user's
+                latest SIF semantic gaps (up to 6 topics — Exa is paid).
+
+    Returns:
+        Dict with per-topic competitor content results.
+    """
+    try:
+        user_id = str(current_user.get("id"))
+
+        # If no topics provided, fetch from SIF semantic gaps
+        if not topics:
+            try:
+                from services.intelligence.agents.specialized import StrategyArchitectAgent
+                from services.intelligence.txtai_service import TxtaiIntelligenceService
+
+                integration = OnboardingDataIntegrationService()
+                db_session = get_session_for_user(user_id)
+                if db_session:
+                    try:
+                        integrated = integration.get_integrated_data_sync(
+                            user_id, db_session
+                        )
+                        competitor_indices = []
+                        if integrated and integrated.get("competitor_analysis"):
+                            competitor_indices = [
+                                i
+                                for i, _ in enumerate(
+                                    integrated["competitor_analysis"]
+                                )
+                            ]
+                        agent = StrategyArchitectAgent(
+                            TxtaiIntelligenceService(user_id), user_id
+                        )
+                        gaps = await agent.find_semantic_gaps(competitor_indices)
+                        # Fewer topics for Exa (paid API)
+                        topics = [g["topic"] for g in gaps[:6]]
+                    finally:
+                        db_session.close()
+            except Exception as e:
+                logger.warning(
+                    f"Could not derive topics from SIF gaps: {e}. "
+                    "Pass topics explicitly."
+                )
+                return {
+                    "results": [],
+                    "message": "No topics provided and unable to derive from SIF gaps.",
+                }
+
+        if not topics:
+            return {
+                "results": [],
+                "message": "No topics to analyze. Complete onboarding and SIF indexing first.",
+            }
+
+        # Get competitor domains from onboarding
+        competitor_domains = []
+        db_session = get_session_for_user(user_id)
+        if db_session:
+            try:
+                analyses = (
+                    db_session.query(CompetitorAnalysis)
+                    .join(
+                        OnboardingSession,
+                        CompetitorAnalysis.session_id == OnboardingSession.id,
+                    )
+                    .filter(OnboardingSession.user_id == user_id)
+                    .filter(CompetitorAnalysis.competitor_domain.isnot(None))
+                    .all()
+                )
+                competitor_domains = list(
+                    set(a.competitor_domain for a in analyses if a.competitor_domain)
+                )
+            finally:
+                db_session.close()
+
+        if not competitor_domains:
+            return {
+                "results": [],
+                "message": "No competitor domains found. Complete onboarding Step 3.",
+            }
+
+        # Run Exa competitor deep-dive
+        from services.seo_tools.competitor_content_service import (
+            CompetitorContentService,
+        )
+
+        service = CompetitorContentService()
+        result = await service.deep_dive(topics, competitor_domains)
+        return result
+
+    except Exception as e:
+        logger.error(f"Failed to get competitor content: {e}")
+        raise HTTPException(
+            status_code=500, detail=f"Failed to get competitor content: {str(e)}"
+        )
+
+
+async def get_content_gap_radar(
+    current_user: dict = Depends(get_current_user),
+    bypass_cache: bool = False,
+) -> Dict[str, Any]:
+    """
+    Run the Content Gap Radar pipeline — the full Phase 3 agent.
+
+    Orchestrates SIF semantic gap analysis, SERP ranking presence detection,
+    Exa competitor content deep-dive, and trend momentum scoring into a
+    single ROI-ranked list of content opportunities.
+
+    Returns scored gaps with per-topic evidence and a summary.
+    """
+    try:
+        user_id = str(current_user.get("id"))
+
+        # Fetch competitor domains + indices from onboarding data
+        competitor_domains = []
+        competitor_indices = []
+
+        db_session = get_session_for_user(user_id)
+        if db_session:
+            try:
+                # Competitor domains
+                analyses = (
+                    db_session.query(CompetitorAnalysis)
+                    .join(
+                        OnboardingSession,
+                        CompetitorAnalysis.session_id == OnboardingSession.id,
+                    )
+                    .filter(OnboardingSession.user_id == user_id)
+                    .filter(CompetitorAnalysis.competitor_domain.isnot(None))
+                    .all()
+                )
+                competitor_domains = list(
+                    set(
+                        a.competitor_domain
+                        for a in analyses
+                        if a.competitor_domain
+                    )
+                )
+
+                # Competitor indices from integrated data
+                integration = OnboardingDataIntegrationService()
+                integrated = integration.get_integrated_data_sync(
+                    user_id, db_session
+                )
+                if integrated and integrated.get("competitor_analysis"):
+                    competitor_indices = [
+                        i
+                        for i, _ in enumerate(
+                            integrated["competitor_analysis"]
+                        )
+                    ]
+            finally:
+                db_session.close()
+
+        if not competitor_domains:
+            return {
+                "gaps": [],
+                "summary": {},
+                "message": "No competitor domains found. Complete onboarding Step 3.",
+            }
+
+        # Run the agent
+        from services.intelligence.agents import ContentGapRadarAgent
+        from services.intelligence.txtai_service import TxtaiIntelligenceService
+
+        agent = ContentGapRadarAgent(
+            TxtaiIntelligenceService(user_id), user_id
+        )
+        result = await agent.analyze(
+            competitor_domains=competitor_domains,
+            competitor_indices=competitor_indices,
+            bypass_cache=bypass_cache,
+        )
+        return result
+
+    except Exception as e:
+        logger.error(f"Failed to run content gap radar: {e}")
+        raise HTTPException(
+            status_code=500,
+            detail=f"Failed to run content gap radar: {str(e)}",
+        )
+
+
+class GenerateContentRequest(BaseModel):
+    topic: str
+    recommended_action: str = ""
+    scoring: Optional[Dict[str, float]] = None
+    serp_evidence: Optional[Dict[str, Any]] = None
+    sif_gap: Optional[Dict[str, Any]] = None
+
+
+async def generate_content_from_gap(
+    request: GenerateContentRequest,
+    current_user: dict = Depends(get_current_user),
+) -> Dict[str, Any]:
+    """
+    Generate a content brief from a content gap radar item and save it
+    as a blog ContentAsset so the user can resume in the Blog Writer.
+    """
+    try:
+        user_id = str(current_user.get("id"))
+        from services.intelligence.agents import ContentGapRadarAgent
+        from services.intelligence.txtai_service import TxtaiIntelligenceService
+
+        agent = ContentGapRadarAgent(
+            TxtaiIntelligenceService(user_id), user_id
+        )
+        brief_result = await agent.generate_content_brief(
+            topic=request.topic,
+            recommended_action=request.recommended_action,
+            scoring=request.scoring,
+            serp_evidence=request.serp_evidence,
+            sif_gap=request.sif_gap,
+        )
+
+        # Create blog ContentAsset so user can resume in Blog Writer
+        from services.content_asset_service import ContentAssetService
+        from models.content_asset_models import AssetType, AssetSource
+        from services.database import get_db_session
+
+        session = get_db_session()
+        asset_id = None
+        if session:
+            try:
+                svc = ContentAssetService(session)
+                asset = svc.create_asset(
+                    user_id=user_id,
+                    asset_type=AssetType.TEXT,
+                    source_module=AssetSource.BLOG_WRITER,
+                    filename=f"gap_{int(time.time())}.md",
+                    file_url=f"/api/blog/content/pending",
+                    title=request.topic,
+                    description=f"Content brief from gap analysis: {request.topic}",
+                    tags=["content-gap", "seo-dashboard"],
+                    asset_metadata={
+                        "phase": "research",
+                        "research_keywords": request.topic,
+                        "topic": request.topic,
+                        "research_data": brief_result,
+                        "outline_data": None,
+                        "content_data": None,
+                        "seo_data": None,
+                        "publish_data": None,
+                    },
+                )
+                asset_id = asset.id
+                logger.info(
+                    f"Created blog asset {asset_id} for gap topic '{request.topic}'"
+                )
+            except Exception as e:
+                logger.warning(f"Failed to create blog asset: {e}")
+            finally:
+                session.close()
+
+        return {
+            "success": True,
+            "brief": brief_result["brief"],
+            "asset_id": asset_id,
+        }
+
+    except Exception as e:
+        logger.error(f"Failed to generate content from gap: {e}")
+        raise HTTPException(
+            status_code=500,
+            detail=f"Failed to generate content brief: {str(e)}",
+        )
+
+
 async def get_onboarding_task_health(
    current_user: dict = Depends(get_current_user),
    site_url: Optional[str] = None,