● 开发者预览 (Developer Preview)

🦉 OwlCoda

装在你自己电脑里的 AI 编程助手。像 Claude Code，但模型、工具、数据全在本地——不登录、不上云。

38高频发版轮次

0.15.3当前 npm latest

v0.15.3GPL 源码 tag · 同号

R24双线收敛 · showcase

3.7满分 5 · B→B+ 下沿

健康度走势（历次评估）

2.9 起步 → 3.7 现在

R24 · 三件结构性进展

source-open：从可读 → 可演示 + 可治理 + 可对账

① 收敛

npm 与源码 tag 同号了

npm 0.15.x 与公仓 GPL source tag 逐版同号（0.15.0/1/2/3）。SOURCE.md 的对应源码义务现在有真实可对账映射，合规从设计变事实。

已落地 · 双线同号

② 演示

首个公开 showcase

世界杯预测器：五角色模型辩论 demo（侦查 / 视觉 / 正方 / 反方 / 裁判），全 web app + OwlCoda 引擎面板。把「本地多模型编排」从说变成看得见。

已公开 · demo

③ 治理

外部贡献有闸了

PR 模板 + CODEOWNERS：外部贡献需人工批准，从纸面变机械。已实测幸存 3 次源码重发布，治理文件作为发布不变量保留。

已落地 · process

体检表 & 考试成绩

六个维度打分 · 行业考卷结果

OwlCoda 六项体检

🔒 信任（数据安全）4.3 · 源码可审计 · 双线对账

🎯 产品定位 ↑showcase3.7 · 中立基底

⚙️ 跑得对不对3.6 · 正确性 cluster

🔌 生态（模型/工具）↑showcase 演示3.5 → 3.7

🛠️ 好不好维护 ↑CI+治理闸3.2 → 3.3

💰 花钱（省不省 token）↑账本诚实3.5 → 3.6

好 (3.5+) 中 (3.0) 待补 (<2.5) source-open 改变信任与生态底座 ↑

SWE-bench 考试

62%非空答卷得分
(77 / 124 题)

300 题里有效作答 124 题
其余多为网络/额度故障，不算分
顶尖闭源模型 ~90%，差距明确
意义：已进考场，有了可对比的基线

我在盯的大决策

26 项 · 挑重点说人话

已完成

自动修复活没过检查就自动重做

发版必检查发布前强制自检，不准跳过

AI 隔离干活并行不打架，故障不连坐

LSP 接真功能代码跳转从空壳变真

自动化体检CI 自托管常驻，发版前全套体检

省钱缓存对话前缀缓存，重复内容不重发

自适应并发AI 群干活自动调速，已发 0.14.44

跨进程额度协调多窗口共用额度池，0.14.46 已实现

操作模式默认开plan/normal/auto 翻默认，第 1 条 cutover

项目地图默认开对标 CC 项目记忆，第 2 条 cutover

GPL 源码公开v0.15.0–0.15.3 公仓源码线

供应链安全审计skill RCE / symlink / root 删除保护

双线版本同号 ✨新npm 0.15.x ↔ GPL source tag 逐版对齐

贡献治理闸 ✨新PR 模板 + CODEOWNERS，外部贡献需批准

造好了 · 等开默认 / 早期播种

权限闸门删库等危险操作默认拦住

写入溯源AI 只能写它该写的文件

行为账本对账"说做了"vs"真做了"可审计，先观测

破高原的大门槛（3 选 1 先啃）

SWE 干净跑满 300已降级但仍是破高原质量数字

体检项补全12 项还差 F6/F11（内部证据）

对话循环显式状态机内部重构，提可维护性

🔗 双线已收敛同号 · npm 与源码线怎么读（本轮更新）

OwlCoda 现在是 npm 安装 + GPL 源码可审计的双线结构，且两条线逐版同号。npm 给用户装；公仓 tag 给源码、许可证和对应源码义务对账——同一个版本号能在两边对上。

npm runtime line
当前 latest 是 0.15.3。开源后主线进入 0.15.x；0.15.2/0.15.3 上 npm dist，0.15.0/0.15.1 为源码-only tag。

GPL source line
公仓 tag v0.15.3 与 npm 同号。0.15.0/1/2/3 逐版对应 SOURCE.md 对应源码义务，映射已记录可对账。

纪律已实跑：公仓 tag 逐版打，npm publish / website deploy 在 0.15.2/0.15.3 双线齐发。配套首个公开 demo（世界杯五角色辩论）+ 外部贡献治理闸（PR 模板 + CODEOWNERS）落地。

数据来源：KANBAN.md / ASSESSMENT-2026-05-30.md（R24 · 2026-06-13 · npm 0.15.3 · GPL source v0.15.3 双线同号）· 公仓 tag v0.15.3
口径：健康度=6 维加权均分（≈3.7）· source-open 是定位/信任里程碑，不直接宣传 SWE clean score · 仅供架构跟踪，非对外宣传数字
本轮（R24）：双线收敛同号 + 首个公开 showcase + 贡献治理闸。评分维持 3.7：source-open 从可读走到可演示+可治理+可对账，但破高原三门槛仍未 ship。下一跳不是再堆小修，是 fitness 补全、显式状态机或 clean SWE 证据。