每个阶段都留痕
33 个阶段,每一个都把它的产物写进运行目录——事件日志、校验 JSON、QA 报告、对账表。整条链可以从结论一路回溯到原始数据,没有黑箱。这正是 pai.ink「每篇文章都带来源清单」背后的同一套理念。
AI 工作流架构
我专门把复杂的专业工作——比如一份机构级研报——拆成几十个可追溯、可审计、会随时间变可靠的阶段。下面这条 33 阶段的研报流水线,是正在跑的真实例子。
↓ 看完整 33 阶段流程流水线
从读完历史教训开工,到四层终审后才入库——每个阶段都产出一份被追踪的产物。点开任意阶段看它做了什么、留下了什么。
先读完所有历史教训,再决定做什么。
逐条读完 INCIDENTS.md,为每个历史事故登记一条确认,本轮带着教训开工。
从提示里解析出 {ticker, company, listing};含糊时只问一次。
中文还是英文,必须由用户或 USER.md 决定,不可从聊天语言臆测。
美股 + A 模式才触发,设置合规的 EDGAR User-Agent。
四张卡共用一个配色,需用户确认。
在跑之前先校验工作流契约本身没有漂移。
查历史同票、同业、近 14 天宏观快照——能复用就不重复采集。
三路同时跑,再收敛成一条边际洞察。
三个 agent 并发,各管一摊:
从三路材料里提炼出非共识的边际信息。
每一步分析都派两个独立同行复核。
财务分析 → 预测瀑布 → Sankey 注入,锁定为一个不可拆的序列。
两个独立同行平行复核,互不通气:
五力逐项结构化,每一力都带数据锚与可证伪点。
两个独立同行平行复核五力,互不通气:
把质检之间的分歧合并成一条可追溯的裁决。
对历史、同业、宏观的漂移做规则化校验,自相矛盾就报警。
只填锁定骨架,再让攻击者来找真缺陷。
只能填充 SHA256 锁定的 HTML 骨架,禁止手写简化版。
结构不符就把简化稿丢弃、回到锁定骨架重写。
失败回到 P5 · 上限 2
终稿里的每个数字都要对得上来源,对不上就重写。
失败回到 P5 · 上限 2
强制 5 力 × 6 个必填段落,深度不够打回 P3。
失败回到 P3 · 上限 1
两个攻击者并行开火,成功标准是找到真缺陷:
失败回到 P5 · 上限 1
按四档严格度之一打包审查,状态只能落在白名单内。
四张社交卡,渲染前再过一轮红队。
生成品牌字标,先存入本轮 cards/ 目录再登记路径。
把研报浓缩进四张卡的内容槽。
审查卡片里有没有写死、未经来源支撑的数字。
在字数与像素预算之内把内容填进版式。
确定性脚本检查卡片槽位结构。
网络事实核查,反复直到结果稳定(≤3)。
失败回到 P10 · 上限 3
逐槽检查分析口径与数据锚,不达标回到 P8。
失败回到 P8 · 上限 1
渲染前两个攻击者对四张卡并行开火:
失败回到 P9 · 上限 1
渲染 4 张 PNG,配色必须等于 P0 选定的那一个。
四层终审 + 事故复检都绿,才允许入库。
数值对账 · 卡片 OCR · 网络三方核查 · 知识库交叉验证。
再读一遍 INCIDENTS.md,确认每条历史事故在本轮都没有复发。
单事务写入知识库;终审与复检双绿才执行,失败即回滚。
为什么不一样
33 个阶段,每一个都把它的产物写进运行目录——事件日志、校验 JSON、QA 报告、对账表。整条链可以从结论一路回溯到原始数据,没有黑箱。这正是 pai.ink「每篇文章都带来源清单」背后的同一套理念。
两轮红队(数值攻击者 + 叙事攻击者),加上四个质检同行 agent 与一个交叉校验器。它们的成功标准不是「通过」,而是「找到真缺陷」——成果在交到你手上之前,先被自己人逐项挑刺。
出过的每一个错都记进 INCIDENTS.md,并固化成一条开工前必读、收工后必检的规则。系统跑得越久,积累的经验越多——它不再是个 Jr. AI agent,而是一步步长成 Senior、乃至 VP 级别的 AI agent。下面是其中几条:
事故 交互式 P0 闸被「自己编一个默认值」绕过。
护栏 watchdog 现在拒绝在非白名单来源上越过这些闸。
事故 锁定的 HTML 模板被跳过,输出了手写的简化稿。
护栏 终稿必须由 SHA256 锁定骨架填充,结构闸会打回简化稿。
事故 波特五力槽位被填成自由叙事,跳过了质检审议格式。
护栏 深度闸强制 5 力 × 6 段,并在 P5 入口再校验一次。
工作流真正难的不是跑通一次,而是让每一次的产出质量都完全一样。这条流水线就是为「稳定」而建:层层闸门和对抗审查让质量不随模型或状态波动。在此之上它高效、覆盖全面,要改时只需动其中一个阶段而不牵一发动全身,且每一步都可追溯、可审计。如果你有一项「做错代价很高」的专业工作想自动化——研究、尽调、合规、报告——我们聊聊。