● 开发者预览 (Developer Preview)

🦉 OwlCoda

装在你自己电脑里的 AI 编程助手。像 Claude Code,但模型、工具、数据全在本地——不登录、不上云。
38高频发版轮次
0.15.3当前 npm latest
v0.15.3GPL 源码 tag · 同号
R24双线收敛 · showcase
3.7满分 5 · B→B+ 下沿
健康度走势(历次评估)
2.9 起步 → 3.7 现在

R24 · 三件结构性进展

source-open:从可读 → 可演示 + 可治理 + 可对账
① 收敛

npm 与源码 tag 同号了

npm 0.15.x 与公仓 GPL source tag 逐版同号(0.15.0/1/2/3)。SOURCE.md 的对应源码义务现在有真实可对账映射,合规从设计变事实。

已落地 · 双线同号
② 演示

首个公开 showcase

世界杯预测器:五角色模型辩论 demo(侦查 / 视觉 / 正方 / 反方 / 裁判),全 web app + OwlCoda 引擎面板。把「本地多模型编排」从说变成看得见。

已公开 · demo
③ 治理

外部贡献有闸了

PR 模板 + CODEOWNERS:外部贡献需人工批准,从纸面变机械。已实测幸存 3 次源码重发布,治理文件作为发布不变量保留。

已落地 · process

体检表 & 考试成绩

六个维度打分 · 行业考卷结果

OwlCoda 六项体检

🔒 信任(数据安全)4.3 · 源码可审计 · 双线对账
🎯 产品定位 ↑showcase3.7 · 中立基底
⚙️ 跑得对不对3.6 · 正确性 cluster
🔌 生态(模型/工具)↑showcase 演示3.5 → 3.7
🛠️ 好不好维护 ↑CI+治理闸3.2 → 3.3
💰 花钱(省不省 token)↑账本诚实3.5 → 3.6
好 (3.5+) 中 (3.0) 待补 (<2.5) source-open 改变信任与生态底座 ↑

SWE-bench 考试

62%非空答卷得分
(77 / 124 题)
  • 300 题里有效作答 124 题
  • 其余多为网络/额度故障,不算分
  • 顶尖闭源模型 ~90%,差距明确
  • 意义:已进考场,有了可对比的基线

我在盯的大决策

26 项 · 挑重点说人话

已完成

自动修复活没过检查就自动重做
发版必检查发布前强制自检,不准跳过
AI 隔离干活并行不打架,故障不连坐
LSP 接真功能代码跳转从空壳变真
自动化体检CI 自托管常驻,发版前全套体检
省钱缓存对话前缀缓存,重复内容不重发
自适应并发AI 群干活自动调速,已发 0.14.44
跨进程额度协调多窗口共用额度池,0.14.46 已实现
操作模式默认开plan/normal/auto 翻默认,第 1 条 cutover
项目地图默认开对标 CC 项目记忆,第 2 条 cutover
GPL 源码公开v0.15.0–0.15.3 公仓源码线
供应链安全审计skill RCE / symlink / root 删除保护
双线版本同号 ✨新npm 0.15.x ↔ GPL source tag 逐版对齐
贡献治理闸 ✨新PR 模板 + CODEOWNERS,外部贡献需批准

造好了 · 等开默认 / 早期播种

权限闸门删库等危险操作默认拦住
写入溯源AI 只能写它该写的文件
行为账本对账"说做了"vs"真做了"可审计,先观测

破高原的大门槛(3 选 1 先啃)

SWE 干净跑满 300已降级但仍是破高原质量数字
体检项补全12 项还差 F6/F11(内部证据)
对话循环显式状态机内部重构,提可维护性

🔗 双线已收敛同号 · npm 与源码线怎么读(本轮更新)

OwlCoda 现在是 npm 安装 + GPL 源码可审计的双线结构,且两条线逐版同号。npm 给用户装;公仓 tag 给源码、许可证和对应源码义务对账——同一个版本号能在两边对上。

npm runtime line
当前 latest 是 0.15.3。开源后主线进入 0.15.x;0.15.2/0.15.3 上 npm dist,0.15.0/0.15.1 为源码-only tag。
GPL source line
公仓 tag v0.15.3 与 npm 同号。0.15.0/1/2/3 逐版对应 SOURCE.md 对应源码义务,映射已记录可对账。

纪律已实跑:公仓 tag 逐版打,npm publish / website deploy 在 0.15.2/0.15.3 双线齐发。配套首个公开 demo(世界杯五角色辩论)+ 外部贡献治理闸(PR 模板 + CODEOWNERS)落地。