DeepSeek 发布了推理模型 R1-Lite-Preview

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 33 天前的主题，其中的信息可能已经有所发展或是发生改变。

看 V2 好像没人提发一下这个新闻 https://api-docs.deepseek.com/zh-cn/news/news1120

使用： https://chat.deepseek.com/

省流：

类似 o1-mini 的模型，能输出思考过程并反复推理，官方给出的 benchmark 在部分领域打败了 o1-preview
目前每天可用 50 次据称未来会完整开源基座模型 R1
实际体验目前不支持上传文件解析，感觉下来确实是聪明了一些不过 token 消耗也很恐怖：比较一下 1.11 和 1.8 数字大小那个思维过程就要写篇小作文。个人认为完整模型如果开源的话，确实会成为 LLM 的搅局者，想起来上半年李彦宏说开源模型会越来越落后有点贻笑大方了。

6 条回复 • 2024-11-22 12:39:02 +08:00

cat9life

33 天前

看起来很有意思，支持 api 了吗

zhmouV2

33 天前

@cat9life #1 目前还不支持

cookii

33 天前 via Android

支持 deepseek ，国产里面算好用的

PositionZero

33 天前

过度思考太严重了，问了一道数学题思考五分钟，花了 15000 tokens ，同样问题 gpt-4o 不思考也能做对。不过确实很厉害，不知道 kimi 的 k0-math 什么水平

A1st0n

33 天前

感觉 deepseek 在代码问答还不是如 ChatGPT 免费版

linglingfa

33 天前

国内的诸多模型我也都一直在尝试和测试。

应该来说，Deepseek 算是代码能力相对比较优秀的一款国产大模型。

不方便注册 openai 或者 claude 的朋友，也可以考虑让 deepseek 来帮你。

当然，缺点也有，就是 deepseek 出代码的速度相对较慢。

有时候写的代码行数(字数) 一多的话，就看着 deepseek 一个字母一个字母的给你输出，那种感觉真酸爽。特别是当你习惯了 ChatGPT 和 claude 的代码输出之后。