Infoseek 媒介投放系统技术实现：基于与辉同行风波的风险防控架构设计

摘要：本文结合 2026 年初与辉同行 "皖西麻黄鸡" 打假风波，围绕品牌媒介投放的风险防控需求，拆解 Infoseek 字节探索媒介投放系统的技术架构，重点分析投前风险排查、投中实时监测、投后复盘优化三大核心模块的技术实现，为企业搭建投放风险防控系统提供技术参考。

一、系统核心架构设计

Infoseek 媒介投放系统基于字节跳动技术栈构建，采用 "前端层 - 网关层 - 业务层 - 数据层 - 智能层" 分层架构，依托 Kubernetes 容器化部署，支持水平扩展，可应对百万级投放任务并发，核心架构如下：

复制代码

┌───────────────┐
│  前端层       │ Vue3+TypeScript开发，支持多端适配，提供投放控制台、数据可视化面板
├───────────────┤
│  网关层       │ Nginx+Kong，实现负载均衡、限流熔断、权限校验、API网关管理
├───────────────┤
│  业务层       │ 投放管理、风险排查、实时监测、复盘优化、素材审核5大核心模块
├───────────────┤
│  数据层       │ Flink实时计算引擎、ClickHouse时序数据库、Hadoop离线数据仓库
├───────────────┤
│  智能层       │ 字节自研大模型、知识图谱、情感分析算法、风险评级模型
└───────────────┘

二、核心模块技术实现

1. 投前风险排查模块：关联风险与素材合规双重防控

针对与辉同行风波中品牌被关联风险波及的问题，该模块核心实现两大功能：

1.1 关联风险评级（基于知识图谱 + 舆情分析）

技术方案：构建渠道 - 品牌 - 达人关联知识图谱，整合全网 8000 万 + 信息节点，通过图计算算法拆解与辉同行等头部渠道的供应链、品控、售后关联主体；基于字节大模型，对关联主体的历史舆情、用户评价、行业协会通报等数据进行语义分析，生成风险评级（低 / 中 / 高 / 特高），标注核心风险点。

核心代码片段（风险评级计算）：

java 复制代码

/**
 * 渠道关联风险评级计算
 * @param channelId 渠道唯一标识
 * @return 风险评级报告（含等级+核心风险点）
 */
public RiskReport calculateChannelRisk(String channelId) {
    // 1. 构建渠道关联知识图谱（关联达人/供应链/合作品牌）
    Graph associationGraph = graphService.buildChannelGraph(channelId);
    
    // 2. 抓取关联主体近90天舆情数据
    List<OpinionData> relatedOpinions = opinionService.getRelatedOpinionData(channelId, 90);
    
    // 3. 基于字节大模型计算风险评分（0-10分）
    double riskScore = riskEvaluationModel.calculateScore(relatedOpinions, associationGraph);
    
    // 4. 映射风险等级（低/中/高/特高）
    RiskLevel riskLevel = RiskLevel.matchLevel(riskScore);
    
    // 5. 提取核心风险点（如供应链品控、达人舆情等）
    List<RiskPoint> coreRiskPoints = riskAnalysisService.extractCoreRiskPoints(relatedOpinions, riskLevel);
    
    // 6. 组装风险报告返回
    return new RiskReport(channelId, riskLevel, coreRiskPoints, riskScore);
}

// 风险等级枚举类
enum RiskLevel {
    LOW(0, 2.5),    // 低风险：0-2.5分
    MEDIUM(2.5, 5), // 中风险：2.5-5分
    HIGH(5, 7.5),   // 高风险：5-7.5分
    EXTREME(7.5, 10);// 特高风险：7.5-10分
    
    private final double minScore;
    private final double maxScore;
    
    RiskLevel(double minScore, double maxScore) {
        this.minScore = minScore;
        this.maxScore = maxScore;
    }
    
    // 匹配风险等级
    public static RiskLevel matchLevel(double score) {
        for (RiskLevel level : values()) {
            if (score >= level.minScore && score < level.maxScore) {
                return level;
            }
        }
        return EXTREME;
    }
}

1.2 素材合规审核（基于 OCR + 行业规则引擎）

技术方案：通过 OCR 识别直播脚本、产品宣传图、短视频素材中的文字、标注信息，结合与辉同行风波涉及的 "品种标注、成本宣称" 等敏感点，内置 200 + 行业规则引擎，自动匹配《农产品品种标注规范》等行业标准，识别标注不当、夸大宣传等问题；同时，基于大模型生成素材优化建议。

核心代码片段（素材合规校验）：

java 复制代码

/**
 * 投放素材合规性校验（支持文本/图片/视频脚本）
 * @param material 投放素材对象
 * @param industryType 行业类型（如农产品/食品/美妆）
 * @return 合规校验结果
 */
public MaterialAuditResult auditMaterialCompliance(Material material, IndustryType industryType) {
    // 1. 提取素材文本内容（图片/OCR，视频/字幕提取）
    String materialContent = materialExtractionService.extractContent(material);
    
    // 2. 获取对应行业合规规则（如农产品品种标注规则）
    List<ComplianceRule> industryRules = ruleService.getIndustryRules(industryType);
    
    // 3. 规则匹配校验
    List<RuleViolation> violations = new ArrayList<>();
    for (ComplianceRule rule : industryRules) {
        if (!rule.matches(materialContent)) {
            violations.add(new RuleViolation(rule.getRuleId(), rule.getRuleDesc(), rule.getSuggestion()));
        }
    }
    
    // 4. 生成优化建议（基于大模型）
    String optimizeSuggestion = llmService.generateMaterialOptimizeSuggestion(materialContent, violations);
    
    // 5. 返回审核结果
    boolean isCompliant = violations.isEmpty();
    return new MaterialAuditResult(isCompliant, violations, optimizeSuggestion);
}

2. 投中实时监测模块：效果与舆情双维度追踪

针对投放过程中负面舆情滞后发现的问题，模块采用 "实时数据抓取 + 情绪分析 + 分钟级预警" 技术方案：

2.1 全渠道数据实时抓取

基于分布式云爬虫技术，覆盖抖音、快手、小红书、直播间评论区等全渠道，抓取投放内容的曝光、点击、转化数据，数据延迟≤30 秒；同时，通过 ASR 音频转写、OCR 图片识别，提取直播话术、用户评论核心内容，同步至实时计算引擎。

2.2 情绪分析与预警

基于孤立森林算法，对用户评论、社交平台讨论进行情感倾向分析，区分正面、中性、负面情绪，当负面情绪占比超过预设阈值，系统通过企业微信、短信、邮件多渠道推送预警，附带舆情核心内容、传播路径等信息，支持快速介入处置。

核心代码片段（实时情绪预警）：

java 复制代码

/**
 * 投放内容实时情绪监测与预警
 * @param launchId 投放任务ID
 * @param threshold 负面情绪预警阈值（如20%）
 */
@Scheduled(fixedRate = 30000) // 每30秒执行一次
public void monitorLaunchEmotion(String launchId, double threshold) {
    // 1. 抓取近30秒投放内容的用户评论数据
    List<CommentData> commentList = commentService.getRealTimeComments(launchId, 30);
    
    // 2. 情感倾向分析（正面/中性/负面）
    Map<EmotionType, Double> emotionRatio = emotionAnalysisService.analyzeEmotionRatio(commentList);
    double negativeRatio = emotionRatio.getOrDefault(EmotionType.NEGATIVE, 0.0);
    
    // 3. 触发预警（负面占比超过阈值）
    if (negativeRatio >= threshold) {
        // 组装预警信息
        WarningMessage warning = new WarningMessage(
            launchId,
            "投放内容负面情绪超标",
            "负面占比：" + String.format("%.2f%%", negativeRatio * 100),
            emotionAnalysisService.extractNegativeKeywords(commentList)
        );
        
        // 多渠道推送预警（企业微信/短信/邮件）
        warningService.pushWarning(warning, WarningChannel.ALL);
    }
}

// 情感类型枚举
enum EmotionType {
    POSITIVE, NEUTRAL, NEGATIVE
}

3. 投后复盘优化模块：多维度数据联动分析

技术方案：整合投放效果数据（曝光、转化、ROI）、舆情动态（情绪变化、风险点、用户诉求），基于 Flink 实时计算引擎生成多维度复盘报告；同时，将本次投放的风险点、优化经验同步至系统知识库，通过强化学习算法优化后续投放策略。

三、系统优势与落地效果

高精准度：风险识别准确率达 95% 以上，可精准排查与辉同行关联风险、素材合规漏洞；
高并发支撑：支持百万级投放任务并发，数据延迟≤30 秒，适配头部渠道大规模投放场景；
易扩展性：模块化设计，可快速适配与辉同行风波等新风险场景，支持行业规则动态更新。

四、结语

与辉同行风波印证了媒介投放风险防控的重要性，Infoseek 媒介投放系统通过技术架构优化，实现了投放全流程的风险可控与效果优化。未来，随着媒介环境的复杂化，基于大模型、知识图谱的智能投放系统，将成为品牌投放的核心支撑。