新对话
未连接
设置
API Base URL
vLLM 的 OpenAI 兼容接口,通常以
/v1
结尾
API Key(可选)
模型
获取模型
System Prompt
采样参数
Temperature
0.7
Top P
0.9
Top K
-1
Max Tokens
2048
Frequency Penalty
0
Presence Penalty
0
Repetition Penalty
1
Seed
Stop Sequences(逗号分隔)
界面
启用流式输出
渲染 Markdown
显示 token 用量与速率