DeepSeek官方发布R1模型推荐设置,这才是大模型正确用法

刚刚,DeepSeek 官网 X 帐号终于更新了(上一次更新还是在 1 月 28 日),官方下场推荐了部署 DeepSeek-R1 的设置。DeepSeek 强调官方部署的版本跟开源版本模型完全一致。内容分为四项。
第一项是:不要使用系统提示词。这个建议其实已经被很多开发者提出过了。

第二项是:温度参数设置为 0.6。至于原因,DeepSeek-R1 项目中写到:「将温度设置在 0.5-0.7 范围内(建议为 0.6),以防止无休止的重复或不连贯的输出。」
第三项,DeepSeek 分享了用于搜索和文件上传的官方提示词。
对于文件上传,建议用户按照模板创建提示,其中 {file_name}、{file_content} 和 {question} 是参数。
filetemplate = \ """[file name]: {filename} [file content begin] {file_content} [file content end] {question}"""
对于网页搜索,参数包括 {search_results}、{cur_data} 和 {question} 。
对于中文查询,使用的提示词是:
对于英文查询,使用的提示词是:
第四项则是一个指南,说明了可以如何缓解模型绕过思考的问题。DeepSeek 写到:「我们观察到 DeepSeek-R1 系列模型在响应某些查询时倾向于绕过思考模式(即输出 \n\n),这可能会对模型的性能产生不利影响。为了确保模型进行彻底的推理,我们建议强制模型对每个输出都以 \n 为其响应的开头。」