fix: credit tracking, voice clone TTL, avatar upload ui, asset serving fallback, OAuth encryption, free plan video renders, backlink outreach sprint

2026-05-25 17:07:35 +05:30
parent 090d69761f
commit 9b3bec698b
99 changed files with 15892 additions and 1278 deletions
--- a/backend/services/backlink_outreach_service.py
+++ b/backend/services/backlink_outreach_service.py
@@ -3,24 +3,25 @@
 from __future__ import annotations

 from dataclasses import dataclass
-from typing import Any, Dict, List
+from typing import Any, Dict, List, Optional
 import re
 import time

 import requests
 from bs4 import BeautifulSoup

-from services.backlink_outreach_models import OpportunityContactInfo, OpportunityRecord, PolicyValidationRequest, PolicyValidationResponse
+import csv
+import io

+from services.backlink_outreach_models import (
+    OpportunityContactInfo, OpportunityRecord,
+    PolicyValidationRequest, PolicyValidationResponse,
+    SendOutreachRequest, SendOutreachResponse,
+    CampaignVolumeResponse, CampaignVolumePoint,
+    ConversionFunnelResponse, FunnelStage,
+)
+from services.backlink_outreach_storage import BacklinkOutreachStorageService

-
-
-# Temporary in-memory control plane until DB wiring is complete
-SUPPRESSION_LIST = set()
-SENT_IDEMPOTENCY_KEYS = set()
-AUDIT_LOGS: list[dict] = []
-SEND_COUNTERS_BY_USER: dict[str, int] = {}
-SEND_COUNTERS_BY_DOMAIN: dict[str, int] = {}
 DEFAULT_USER_DAILY_CAP = 100
 DEFAULT_DOMAIN_DAILY_CAP = 20

@@ -140,8 +141,12 @@ class BacklinkOutreachService:
        return min(1.0, 0.35 + (0.13 * hits))


+    def _get_storage(self) -> BacklinkOutreachStorageService:
+        return BacklinkOutreachStorageService()
+
    def validate_send_policy(self, payload: PolicyValidationRequest) -> PolicyValidationResponse:
        reasons: List[str] = []
+        storage = self._get_storage()

        if payload.workspace_id.startswith("new-") and not payload.approved_by_human:
            reasons.append("human_review_required_for_new_workspace")
@@ -149,19 +154,17 @@ class BacklinkOutreachService:
            reasons.append("invalid_legal_basis")
        if payload.recipient_region.lower() in {"eu", "eea"} and payload.legal_basis.lower() != "consent":
            reasons.append("region_requires_explicit_consent")
-        if not payload.unsubscribe_url:
-            reasons.append("unsubscribe_url_required")
+
        if len(payload.sender_identity.strip()) < 3:
            reasons.append("sender_identity_required")

-        recipient_key = f"{payload.recipient_email.lower()}::{payload.recipient_domain.lower()}"
-        if recipient_key in SUPPRESSION_LIST:
+        if storage.is_suppressed(str(payload.recipient_email), payload.recipient_domain, user_id=payload.user_id):
            reasons.append("recipient_suppressed")
-        if payload.idempotency_key in SENT_IDEMPOTENCY_KEYS:
+        if storage.check_idempotency(payload.idempotency_key, user_id=payload.user_id):
            reasons.append("duplicate_idempotency_key")

-        user_count = SEND_COUNTERS_BY_USER.get(payload.user_id, 0)
-        domain_count = SEND_COUNTERS_BY_DOMAIN.get(payload.recipient_domain.lower(), 0)
+        user_count = storage.get_user_send_count(payload.user_id)
+        domain_count = storage.get_domain_send_count(payload.recipient_domain, user_id=payload.user_id)
        if user_count >= DEFAULT_USER_DAILY_CAP:
            reasons.append("user_daily_cap_exceeded")
        if domain_count >= DEFAULT_DOMAIN_DAILY_CAP:
@@ -170,33 +173,156 @@ class BacklinkOutreachService:
        allowed = len(reasons) == 0
        final_status = "approved" if allowed else "blocked"

-        AUDIT_LOGS.append({
-            "event": "policy_check",
-            "user_id": payload.user_id,
-            "campaign_id": payload.campaign_id,
-            "recipient": str(payload.recipient_email),
-            "allowed": allowed,
-            "reasons": reasons,
-            "override": payload.approved_by_human,
-        })
-
-        if allowed:
-            SENT_IDEMPOTENCY_KEYS.add(payload.idempotency_key)
-            SEND_COUNTERS_BY_USER[payload.user_id] = user_count + 1
-            SEND_COUNTERS_BY_DOMAIN[payload.recipient_domain.lower()] = domain_count + 1
+        storage.add_audit_log(
+            event="policy_check",
+            user_id=payload.user_id,
+            campaign_id=payload.campaign_id,
+            recipient=str(payload.recipient_email),
+            allowed=allowed,
+            reasons=reasons,
+            override=payload.approved_by_human,
+        )

        return PolicyValidationResponse(allowed=allowed, reasons=reasons, final_status=final_status)

-    def get_reporting_snapshot(self) -> Dict[str, Any]:
-        total_decisions = len(AUDIT_LOGS)
-        approved = sum(1 for row in AUDIT_LOGS if row.get("allowed"))
+    EU_DOMAIN_SUFFIXES = (".de", ".fr", ".it", ".es", ".nl", ".be", ".at", ".se", ".dk", ".fi", ".pt", ".ie", ".gr", ".pl", ".cz", ".ro", ".hu", ".bg", ".hr", ".sk", ".si", ".ee", ".lv", ".lt", ".lu", ".mt", ".cy")
+
+    def _infer_region(self, domain: str) -> str:
+        d = domain.lower()
+        if any(d.endswith(s) or d.endswith(s + "/") for s in self.EU_DOMAIN_SUFFIXES):
+            return "eu"
+        if d.endswith(".uk"):
+            return "uk"
+        if d.endswith(".ca"):
+            return "ca"
+        if d.endswith(".au"):
+            return "au"
+        return "unknown"
+
+    def send_outreach(self, request: SendOutreachRequest) -> SendOutreachResponse:
+        storage = self._get_storage()
+        lead = storage.get_lead(request.lead_id, user_id=request.user_id)
+        if not lead:
+            return SendOutreachResponse(attempt_id="", status="failed", policy_allowed=False, policy_reasons=["lead_not_found"])
+
+        domain = lead.get("domain", request.sender_email.split("@")[-1] if "@" in request.sender_email else "unknown")
+        recipient_region = self._infer_region(domain)
+        legal_basis = "consent" if recipient_region == "eu" else "legitimate_interest"
+
+        policy_req = PolicyValidationRequest(
+            user_id=request.user_id,
+            workspace_id=request.workspace_id,
+            campaign_id=request.campaign_id,
+            recipient_email=lead.get("email", ""),
+            recipient_domain=domain,
+            recipient_region=recipient_region,
+            legal_basis=legal_basis,
+            approved_by_human=False,
+            unsubscribe_url=None,
+            sender_identity=request.sender_email,
+            idempotency_key=request.idempotency_key,
+        )
+        policy = self.validate_send_policy(policy_req)
+
+        attempt = storage.add_attempt(
+            lead_id=request.lead_id,
+            campaign_id=request.campaign_id,
+            idempotency_key=request.idempotency_key,
+            sender_email=request.sender_email,
+            subject=request.subject,
+            body=request.body,
+            status="approved" if policy.allowed else "blocked",
+            decision_reason="; ".join(policy.reasons) if policy.reasons else None,
+            user_id=request.user_id,
+        )
+
+        return SendOutreachResponse(
+            attempt_id=attempt.get("attempt_id", ""),
+            status=attempt.get("status", "failed"),
+            policy_allowed=policy.allowed,
+            policy_reasons=policy.reasons,
+        )
+
+    def get_reporting_snapshot(self, user_id: str = "default") -> Dict[str, Any]:
+        storage = self._get_storage()
+        campaigns = storage.list_campaigns(user_id, user_id, limit=100)
+        total_sent = 0
+        total_replied = 0
+        total_placed = 0
+        total_leads = 0
+        for c in campaigns:
+            cid = c["campaign_id"]
+            attempts = storage.list_attempts(cid, limit=10000, user_id=user_id)
+            leads = storage.list_leads_all(cid, user_id=user_id)
+            total_sent += sum(1 for a in attempts if a.get("status") == "sent")
+            total_replied += storage.count_replies(cid, user_id=user_id)
+            total_placed += sum(1 for l in leads if l.get("status") == "placed")
+            total_leads += len(leads)
+        logs = storage.list_audit_logs("", limit=1000, user_id=user_id)
        return {
-            "send_volume": approved,
-            "decision_events": total_decisions,
-            "response_rate": 0.0,
-            "placement_conversion": 0.0,
+            "send_volume": total_sent,
+            "decision_events": len(logs),
+            "response_rate": round(total_replied / total_sent, 4) if total_sent > 0 else 0.0,
+            "placement_conversion": round(total_placed / total_leads, 4) if total_leads > 0 else 0.0,
        }

+    def get_campaign_volume(self, campaign_id: str, days: int = 30, user_id: str = "default") -> CampaignVolumeResponse:
+        storage = self._get_storage()
+        points = storage.get_send_volume_by_day(campaign_id, days, user_id=user_id)
+        return CampaignVolumeResponse(
+            campaign_id=campaign_id, days=days,
+            volume=[CampaignVolumePoint(**p) for p in points],
+        )
+
+    def get_campaign_funnel(self, campaign_id: str, user_id: str = "default") -> ConversionFunnelResponse:
+        storage = self._get_storage()
+        stages = storage.get_lead_status_counts(campaign_id, user_id=user_id)
+        return ConversionFunnelResponse(
+            campaign_id=campaign_id,
+            stages=[FunnelStage(**s) for s in stages],
+        )
+
+    CSV_LEAD_FIELDS = ["lead_id", "campaign_id", "domain", "page_title", "email", "status", "discovery_source", "created_at"]
+    CSV_ATTEMPT_FIELDS = ["attempt_id", "lead_id", "campaign_id", "sender_email", "subject", "status", "sent_at", "created_at"]
+    CSV_REPLY_FIELDS = ["reply_id", "attempt_id", "from_email", "subject", "classification", "received_at"]
+
+    @staticmethod
+    def _sanitize_csv_value(value: Any) -> str:
+        s = str(value) if value is not None else ""
+        if s and s[0] in ("=", "+", "-", "@", "\t", "\r"):
+            s = "'" + s
+        return s
+
+    def export_leads_csv(self, campaign_id: str, user_id: str = "default") -> str:
+        storage = self._get_storage()
+        leads = storage.list_leads_all(campaign_id, user_id=user_id)
+        output = io.StringIO()
+        writer = csv.DictWriter(output, fieldnames=self.CSV_LEAD_FIELDS, extrasaction="ignore")
+        writer.writeheader()
+        for row in leads:
+            writer.writerows([{k: self._sanitize_csv_value(v) for k, v in row.items()}])
+        return output.getvalue()
+
+    def export_attempts_csv(self, campaign_id: str, user_id: str = "default") -> str:
+        storage = self._get_storage()
+        attempts = storage.list_attempts_all(campaign_id, user_id=user_id)
+        output = io.StringIO()
+        writer = csv.DictWriter(output, fieldnames=self.CSV_ATTEMPT_FIELDS, extrasaction="ignore")
+        writer.writeheader()
+        for row in attempts:
+            writer.writerows([{k: self._sanitize_csv_value(v) for k, v in row.items()}])
+        return output.getvalue()
+
+    def export_replies_csv(self, campaign_id: str, user_id: str = "default") -> str:
+        storage = self._get_storage()
+        replies = storage.list_replies_all(campaign_id, user_id=user_id)
+        output = io.StringIO()
+        writer = csv.DictWriter(output, fieldnames=self.CSV_REPLY_FIELDS, extrasaction="ignore")
+        writer.writeheader()
+        for row in replies:
+            writer.writerows([{k: self._sanitize_csv_value(v) for k, v in row.items()}])
+        return output.getvalue()
+
    async def deep_discover(self, keyword: str, max_results: int = 15) -> Dict[str, Any]:
        """Enhanced discovery using Exa neural search + DuckDuckGo with full-page scraping."""
        from services.backlink_outreach_scraper import BacklinkOutreachScraper
@@ -212,9 +338,15 @@ class BacklinkOutreachService:
            "typed opportunity records and confidence score",
            "deep webpage scraping + contact-page extraction via Exa",
            "quality scoring and guest-post signal detection",
+            "DB-backed policy validation with suppression & idempotency",
+            "outreach attempt recording + status lifecycle",
+            "SMTP email sending via backlink_outreach_sender",
+            "IMAP reply polling with auto-classification",
+            "follow-up scheduling with sent tracking",
+            "email template CRUD + AI generation (llm_text_gen)",
+            "personalized send via template variables",
        ]
        planned = [
-            "email sending automation + response tracking",
            "follow-up orchestration and campaign analytics",
        ]
        return {