三言科技 12月29日消息,12月26日,杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(簡稱“深度求索”)宣布,全新系列模型DeepSeek-V3首個版本上線并同步開源。
深度求索宣稱DeepSeek-V3多項評測成績超越了Qwen2.5-72B和Llama-3.1-405B等其他開源模型,并在性能上和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
據(jù)官方技術(shù)論文披露,v3模型的總訓(xùn)練成本為557.6萬美元,GPT-4o等模型的訓(xùn)練成本約為1億美元。
不過,當(dāng)向DeepSeek-V3提問它是哪家大模型時,它卻給出了“ChatGPT”的答案。而且目前這種bug仍然沒有修復(fù)。
不過,如果中文提問,DeepSeek-V3正確報出了家門。