GPT4-o 或 4o-mini 都行,启用 json-mode
> With this set of optimizations, on iPhone 15 Pro we are able to reach time-to-first-token latency of about 0.6 millisecond per prompt token, and a generation rate of 30 tokens per second.

苹果的端侧模型才 3B ,M1 随便跑无压力
119 天前
回复了 steelshadow39 创建的主题 Apple 后端开发 MacBook 求推荐
没啥问题,就是 16 寸有点大了,一般会外接显示器,用不着那么大,带着不方便。
GitHub Copilot 也能读取整个工作区的代码, 的 GitHub 模式也能读取整个 GitHub 仓库的代码,

Copilot 是直接基于文本相似度检测,devv 是对 embedding 计算相似度
