开发路线图

Development Roadmap & Progress Log · 持续更新

当前版本 v0.4.0 · 快照 2026-07-04

当前状态快照

流水线
v0.4.0
Phase 0-5 + Phase 5M 稳定,生产就绪
评委面板
10 / 10
全部面板可运行,各有首份发布报告
评委全档
15 / 43
28 人待深化(seed 层);P0-A 下一步
公开报告
10 / 10
全部 10 套面板各 1 份,P2-B ✓
集成测试
✓ CI
report-validation.yml 已上线
MCP Server
11 工具
v0.1.0 · 6 核心 + 5 演化 · 67 tests · 发布就绪

关键阻断项

⚠ 当前阻断
1
Wuying 免费版限制GetLink() 返回 400(Pro/Ultra 专属)
影响:25 位中文评委无法抓取 Zhihu / 微信 / X 内容,深化被阻断。解法:升级到 Pro/Ultra。
2
沙箱 WebFetch 403 — paulgraham.com / Wikipedia / CF 防护站点返回 403
影响:vc-en 3 位英文评委(paulgraham/bhorowitz/marcandreessen)深化受阻。解法:通过 Wuying 代理访问,或 Jina Reader 镜像。

评委档案深化进度

全档完成 15 / 43 位评委 35%
default · 默认面板 5 / 5 全档
auto · 新能源汽车 5 / 5 全档
security-cn-global 3 / 6 进行中
vc-en · 英文 VC 2 / 5 待深化
ai-app-cn · AI 应用 2 / 5 待深化
edu-cn · 教育 2 / 5 待深化
vc-cn · 中文 VC 2 / 5 待深化
consumer-cn · 消费品 0 / 5 阻断
cross-border · 出海 0 / 4 阻断
luxury-en · 奢侈品 — / 5 待核查

开发路线图

P0 立即可执行 不依赖外部解锁,当前环境即可完成
A · 深化 vc-en 英文评委(3 人)
paulgraham — paulgraham.com essays 6 路径研究 + quotes.md
英文 essay 无访问限制;需完成 01-06.md 六路径
bhorowitz — a16z.com blog + The Hard Thing About Hard Things
多篇英文长文可直接抓取
marcandreessen — pmarca.com archive + 近期 X/博客发言
需验证当前访问情况,可能需要 Jina Reader
B · 实现 --dry-run 标志
SKILL.md 增加 --dry-run 参数解析
Phase 0 增加 dry-run 分支 §0.5(打印计划后退出,不触发网络请求)
输出:品牌名、选定面板、评委状态 ✓/✗、维度列表、输出路径
docs/05-usage.md 补充 --dry-run 示例(§3.6)
P1 依赖 Wuying Pro 升级 升级后可批量解锁 25 位中文评委深化
A · 升级 Wuying 并验证
升级 Wuying 套餐到 Pro/Ultra
解锁后:运行 scripts/wuying/smoke_test.py 确认 GetLink 可用
B · 批量深化中文评委(按优先级排序)
consumer-cn 5 人:江南春 / 钟睒睒 / 罗永浩 / 阳萌 / 张兰
国内品牌审计需求最大,优先
vc-cn 3 人:张磊 / 徐新 / 沈南鹏
ai-app-cn 3 人:王小川 / 王慧文 / 李木欧
cross-border 4 人:黄峥 / 周受资 / 陈年 / 庄帅
edu-cn 3 人:Sal Khan / 寿松涛 / 黄峥(教育版)
security-cn-global 3 人(剩余)
C · --panel-merge 跨面板对比
设计跨面板对比数据结构
Phase 0.3 ABORT guard + Phase 0.4 bypass clause + Phase 5M 4步流程
SKILL.md Phase 5 增加 panel-merge 逻辑(Phase 5M.1-5M.4)
5M.1 读旧分 → 5M.2 跑新面板 → 5M.3 Panel Comparison 报告模板 → 5M.4 HTML delta 热力图
HTML 报告模板增加跨面板 diff 热力图组件
面板选择器 toggle + 5 镜头 delta 热力图列,docs/05-usage.md §3.7 补充用例
P2 质量与基础设施 测试覆盖 + 报告覆盖扩充
A · 集成测试 Workflow
新增 .github/workflows/report-validation.yml
校验已发布报告的结构完整性;含 mock fixture 自测
创建 tests/fixtures/:mock_report.md + mock_report.html
scripts/validate_report.py:验证 report.md 结构(标题/Score Matrix/5 镜头/Verdict/Legal/Sources)
scripts/validate_html_report.py:验证 HTML 报告含 Chart.js canvas / Mermaid / 热力图 / Verdict / Legal
B · 扩充公开报告(各面板至少 1 份)
选定 8 个品牌(补全 vc-en / security / luxury / ai-app / edu / vc-cn / consumer / cross-border 各 1 份)
奇安信 · Kimi · 好未来 · Anthropic · 元气森林 · 美团 · DJI · 爱马仕;published/reports/*/panel.yaml + reports-meta.yaml 已建档
运行完整审计并发布到 published/reports/
已完成:全部 8 品牌审计报告发布(2026-06-26 至 2026-06-28)
更新 site/reports-meta.yaml(8 条 pending 条目已建档)
published-reports.txt 待审计完成后补充
P3 未来形态 前置:P0/P1 完成,评委档案质量达标
A · MCP Server 封装
确认 MCP Server 框架选型:@modelcontextprotocol/sdk + TypeScript + stdio transport
packages/mcp-server/ · PR-01~03 完成架构 · commit cd2b9ce
实现 6 个核心工具:propose_audit · confirm_audit · get_status · fetch_report · list_audits · add_judge;Phase 2-5 完整编排
PR-04 · 22 tests passing · commit 069c5c4 · 2026-06-30
文档 + 示例调用 + site/agents.html 同步更新
2026-06-30
B · 报告订阅 / 品牌演化追踪
设计触发机制(webhook / cron / keyword / news RSS)
设计文档 docs/12-evolution-tracking.md 完成 · 2026-06-30 · 4 种触发器 + delta 报告格式 + 5 个新 MCP 工具
P3-B-1:subscribe_brand + trigger_evolution + list_subscriptions + unsubscribe_brand + CronScheduler
commit 61fb801 · 2026-06-30 · cadence guard + 月度上限 · 34 tests
P3-B-2:delta 报告生成(get_delta_report + scores.json 结构化打分 + per-lens 均值差 + LLM 变化叙述)
2026-07-02 · 中英文 judge review 解析 · 47 tests
P3-B-5(成本优化):EVOLUTION 增量维度重跑 —— 变化探针只重跑变了的维度
2026-07-02 · 成本 ~$3 → ~$0.3-0.6/次(省 80%+)· 事件精准命中维度 · 52 tests
P3-B-4a:notify 推送出站(webhook POST + Resend email + mcp-push)
2026-07-02 · 审计完成自动算 delta 并推送 · best-effort 逐 target 容错 · 60 tests
P3-B-4b:webhook 接收端(外部推送触发)
需长运行 HTTP daemon(MCP 是 stdio transport)
P3-B-3:keyword / news RSS 触发器
阻断:Wuying Pro GetLink() 抓取中文内容(免费版返回 400)

进度日志

2026-06-25
里程碑 文档
全量代码库分析 · 开发路线图建立
  • 分析全量代码库:43 位评委、10 面板、5 阶段流水线、完整文档集(10 篇设计文档)
  • 整理当前状态快照(v0.2.36):15/43 全档,10/10 面板可运行,2 份公开报告
  • 识别关键阻断项:Wuying 免费版 GetLink 返回 400,WebFetch 对部分站点返回 403
  • 制定 P0-P3 四级优先级路线图
  • 创建 docs/11-roadmap.md 开发路线图与进度日志文档
  • 创建 site/roadmap.html 可视化路线图网页
commit 4d41917 · branch claude/sharp-turing-496l8b
2026-06-25
P0-B 完成 功能
实现 --dry-run 标志(v0.2.37)
  • SKILL.md 参数列表新增 --dry-run 说明
  • Phase 0 新增 §0.5 dry-run exit:运行完路径解析/面板解析/FRESH-EVOLUTION 检测后打印计划并退出,无网络请求、无文件写入
  • 输出格式:品牌名、模式、面板+评委状态(✓/✗)、Wuying leg、维度列表、输出路径、生效 flags
  • 原 §0.5 Write panel.yaml 顺延为 §0.6
  • docs/05-usage.md §3.6 新增 dry-run 完整示例(含与其他 flags 组合)
commit 待推送 · branch claude/sharp-turing-496l8b
2026-06-25
P0-A 阻断 WebFetch 403
vc-en 评委深化尝试 · 确认沙箱阻断
测试 WebFetch paulgraham.com/ds.html 返回 HTTP 403。沙箱网络限制仍然有效(文档记录的 blocker 未解除)。P0-A(vc-en 英文评委深化)挂起,等待 Wuying Pro 升级或网络策略变更。
无 commit · 无文件变更
2026-06-25
P2-A 完成 测试基础设施
集成测试 Workflow 建立(report-validation CI)
  • scripts/validate_report.py:校验 report.md 的 7 条规则(标题格式、Score Matrix 5 镜头含数字分值、Dissent Heatmap、Final Verdict、Legal、Sources)
  • scripts/validate_html_report.py:校验 report.html 的 7 条规则(Chart.js canvas、Mermaid/影响力图、热力图、Verdict、Legal、Sources)
  • tests/fixtures/mock_report.md + mock_report.html:最小合法 fixture,用于校验器自测
  • .github/workflows/report-validation.yml:CI workflow,PR/push to main 时自动跑四步校验
  • 本地全量测试通过:2 份 HTML 报告 ✓,1 份 Markdown 报告 ✓,2 份 mock fixture ✓
commit 待推送 · branch claude/sharp-turing-496l8b
2026-06-25
P1-C 完成 功能
实现 --panel-merge 跨面板对比(v0.2.38)
  • SKILL.md 参数列表新增 --panel-merge(触发 Phase 5M,跳过面板变更拦截)
  • Phase 0.3:FRESH 品牌(无先前报告)ABORT guard
  • Phase 0.4:--panel-merge bypass clause;修改 STOP 条件,排除 panel-merge 触发
  • Phase 5M(新增):5M.1 读旧版分值 → 5M.2 用新面板跑完整 N-Judge → 5M.3 Panel Comparison 报告节(side-by-side delta 表 + 共识/分歧/fingerprint)→ 5M.4 HTML delta 热力图(面板选择器 toggle)
  • docs/05-usage.md §3.7:--panel-merge 两步示例 + 适用场景说明
commit 待推送 · branch claude/sharp-turing-496l8b
2026-06-25
P2-B 基础设施完成 报告扩充
扩充公开报告基础设施(8 品牌建档)
  • 选定 8 个品牌,覆盖全部 8 个待补面板:奇安信(security-cn-global)、Kimi(ai-app-cn)、好未来(edu-cn)、Anthropic(vc-en)、元气森林(consumer-cn)、美团(vc-cn)、DJI(cross-border)、爱马仕(luxury-en)
  • 创建 published/reports/{slug}/panel.yaml × 8(status: pending,锁定面板 + mba_version: 0.2.38)
  • 更新 site/reports-meta.yaml:8 条 pending 条目(含 run_cmd 字段)
  • 待后续运行真实审计后,补充 report.md / report.html,更新 published-reports.txt,移除 pending status
commit 待推送 · branch claude/sharp-turing-496l8b
2026-06-26 — 2026-06-28
P2-B 全部完成 报告扩充
10 套面板首份报告全部发布 · v0.3.0 里程碑
  • 2026-06-26:奇安信(security-cn-global · 185/300 · 6.17)、Kimi 月之暗面(ai-app-cn · 137/200 · 6.85)、Anthropic(vc-en · 191/250 · 7.64)、DJI 大疆(cross-border · 186/250 · 7.44)
  • 2026-06-28:好未来 TAL(edu-cn · 124/200 · 6.20)、元气森林(consumer-cn · 162/250 · 6.48)、美团 Meituan(vc-cn · 194/250 · 7.76)、Hermès 爱马仕(luxury-en · 216/250 · 8.64)
  • MBA 历史纪录 3 项同次创立(Hermès):Identity 9.6 最高 · Origin 9.0 最高 · 总分 8.64/10 最高
  • MBA 首个双重★投资冲突案例(美团:张磊★高瓴 + 沈南鹏★红杉)
  • MBA 首个"品类被政策摧毁后重建"案例(好未来:双减 2021 → AI 重建)
  • 文档更新:README.md 加入 10 份报告汇总表,site/index.html 加统计条 + 计数,site/agents.html 报告数量修正
  • Git tag v0.3.0(本地创建,注释详述各面板首次运行状态)
commit e341eee · branch claude/sharp-turing-496l8b
2026-07-02
P3-B-1+2 完成 演化追踪
品牌订阅 + 演化触发 + delta 报告上线(MCP 11 工具)
  • P3-B-1(commit 61fb801):4 个新工具 subscribe_brand / trigger_evolution / list_subscriptions / unsubscribe_brandSubscriptionStore JSON 持久化;CronScheduler setInterval 轮询到期订阅并 fire-and-forget 触发演化;cadence guard(min_interval_days + max_per_month 月度上限)
  • P3-B-2get_delta_report 工具 + src/orchestrator/scores.ts(从 judge review 解析结构化打分,英文 lens 名作锚点,中英文都能解析);Phase 4 生成时持久化 scores.json;per-lens 均值差 + LLM 变化叙述;旧 audit 无 scores.json 时从 reviews/ 重建
  • MCP Server 现共 11 个工具(6 核心 + 4 订阅 + 1 delta);47 tests passing,TypeScript zero errors
commit 61fb801 + 待推送 · branch claude/sharp-turing-496l8b
2026-06-30
P3-A 完成 MCP Server
MCP Server v0.1.0 — Phase 2-5 完整编排上线
  • PR-01~03:pnpm workspace 架构、类型系统(AuditState / 8 阶段生命周期)、FilesystemStore 原子写入、StateMachine、6 个工具框架(propose_audit / confirm_audit / get_status / fetch_report / list_audits / add_judge)
  • PR-04:接通真实 LLM 调用 — llm/client.ts(Anthropic SDK 封装,3 次重试 429/5xx)、llm/prompts.ts(7 维度 + 合成 + 5 评委 + merge 全套 prompt 模板)、Phase 2-5 四个 orchestrator、orchestrator/runner.ts(非阻塞链式执行,cost guard,失败自动写 failed 状态)
  • confirm_audit 现在真正启动后台 LLM 流水线,get_status 轮询进度;5 个内置评委(傅盛 / Jobs / 李可佳 / 吴俊东 / 张一鸣)
  • 22 tests passing,TypeScript zero errors
  • site/agents.html MCP 段落更新,roadmap P3-A 全部任务勾选
commit 069c5c4 · branch claude/sharp-turing-496l8b
后续进度将在此追加…