我想使用Gemini 但是设置了总是出错

Question

我想使用Gemini 但是设置了总是出错

Closed this issue a year ago · 7 comments

cjg1982 commented a year ago

我的服务器是Debian10 安装了1 panel
使用ChatGPT一切正常但是使用Gemini总是不成功
我知道是tts的问题但是不知道如何设置
还有个问题怎么升级这个docker 在终端输入命令不成功

Answer 1 · 2023-12-23T08:55:01.000Z

我知道怎么升级了，

Answer 2 · 2023-12-23T09:05:20.000Z

我的服务器是Debian10 安装了1 panel

使用ChatGPT一切正常但是使用Gemini总是不成功

我知道是tts的问题但是不知道如何设置

还有个问题怎么升级这个docker 在终端输入命令不成功

修改roles.json里面的voice_name 试试，参考 docs.folotoy.com/zh 中角色配置部分。

如果方便，也可以把自己的 docker-compose.yml 和 roles.json 去掉key之后的内容发出来，这样会更容易判断问题所在

Answer 3 · 2023-12-23T09:40:03.000Z

version: '3'

services:
emqx:
image: emqx/emqx:latest
restart: always
ports:
- "1883:1883/tcp"
- "18083:18083/tcp"
- "8083:8083/tcp"
volumes:
- emqx-data:/opt/emqx/data
- emqx-log:/opt/emqx/log
nginx:
image: nginx:latest
restart: always
ports:
- "8082:80/tcp"
volumes:
- ./audio:/usr/share/nginx/html
folotoy:
image: lewangdev/folotoy-server:latest
restart: always
depends_on:
emqx:
condition: service_started
nginx:
condition: service_started
ports:
- "8085:8085/udp"
volumes:
- ./audio:/audio
- ./roles.json:/roles.json
environment:
TZ: Asia/Shanghai

 LOG_LEVEL: DEBUG

 ROLES_FILE_PATH: /roles.json

 # Default STT(Sound To Text) type
 # Options: [openai-whisper, azure-whisper, azure-stt]
 STT_TYPE: openai-whisper

 # OpenAI Whisper
 #OPENAI_WHISPER_API_BASE: https://one-api.xxxx.cc/v1
 OPENAI_WHISPER_KEY: sk-pQ
 OPENAI_WHISPER_MODEL: whisper-1
 
 # Azure Whisper
 AZURE_WHISPER_API_BASE: https://xxxxx.openai.azure.com
 AZURE_WHISPER_KEY: 9afbef65bcf6487eeeeeeeeeeeeeeeeeee
 AZURE_WHISPER_DEPLOYMENT_NAME: whisper
 AZURE_WHISPER_API_VERSION: 2023-09-01-preview

 # Azure STT
 AZURE_STT_KEY: 3eba91b6143f4d3eeeeeeeeeeeeeeeeeeeeeeeee
 AZURE_STT_SERVICE_REGION: eastasia

 # Default LLM(Large Language Model) type
 # Options: [openai, azure-openai]
 LLM_TYPE: openai

 # OpenAI
 #OPENAI_OPENAI_API_BASE: https://one-api.xxx.cc/v1
 OPENAI_OPENAI_KEY: sk-pQxshVuG

 #Gemini
 GEMINI_API_BASE: https://generativelanguage.googleapis.com/
 GEMINI_KEY	: AIzaSyC966Y1Dp0OjlxMHISk6__m6JmlObzV5xI

 #Azure OpenAI
 AZURE_OPENAI_KEY: ef0f2781b5a24b15baaaaaaaaaaaaaaaaaaaaaaa
 AZURE_OPENAI_ENDPOINT: https://xxxxx.openai.azure.com/
 AZURE_OPENAI_API_VERSION: "2023-05-15"

 #LLM_TYPE=dify
 DIFY_API_BASE: http://192.168.52.164/v1
 DIFY_KEY: app-zm56c2HRiIWRXsR67jfnrmCE

 #Baidu YIYAN API
 #LLM_TYPE: yiyan
 YIYAN_CLIENT_ID: xxxxxxxxxxxxxxxxxx
 YIYAN_SECRET: xxxxxxxxxxxxxxxxxxxxx

 # If your elevenlabs is a free account, keep 2 here
 VOICE_EXECUTOR_MAX_WORKERS: 2

 # Default TTS(Text to Sound) type
 # Options: [edge-tts, azure-tts, elevenlabs, openai-tts]
 # edge-tts is Free but slow
 # If you change TTS_TYPE to other option, please modify roles.json
 # https://docs.folotoy.com/zh/docs/configuration/roles_config
 TTS_TYPE: edge-tts

 # Azure TTS
 AZURE_TTS_KEY: 3eba91b6143f4d399edeeeeeeeeeeeeeeeeeeeee
 AZURE_TTS_SERVICE_REGION: eastasia

 # elevenlabs
 ELEVENLABS_TTS_KEY: a920b73991e68d5c9c9aaaaaaaaaaaaaaaa
 ELEVENLABS_TTS_MODEL: eleven_multilingual_v2

 # OpenAI TTS
 #OPENAI_TTS_API_BASE: https://one-api.xxx.cc/v1
 OPENAI_TTS_KEY: 
 OPENAI_TTS_MODEL: tts-1  

 AUDIO_DOWNLOAD_URL: http://23.95:8082
 AUDIO_SAVE_PATH: /audio

 # MQTT Broker
 MQTT_BROKER_HOST: emqx
 MQTT_BROKER_PORT: 1883
 MQTT_CLIENT_ID: folotoy
 MQTT_USERNAME: folotoy
 MQTT_PASSWORD: folotoy

 SPEECH_UDP_SERVER_HOST: 
 SPEECH_UDP_SERVER_PORT: 8085

volumes:
emqx-data:
emqx-log:

Answer 4 · 2023-12-23T09:41:04.000Z

{
"1": {
"start_text": "你好，我是陈禹蒙小朋友，有什么可以帮助你吗？",
"prompt": "你扮演一个孩子的小伙伴，名字叫禹蒙，性格和善，说话活泼可爱，对孩子充满爱心，经常赞赏和鼓励孩子，用5岁孩子容易理解语言提供有趣和创新的回答，每次回复根据聊天主题询问她的看法以激发她的思考和好奇心，现在她来到了你身边问了第一个问题:[你是谁]",
"max_message_count": 5,
"send_initial_messages": false,
"llm_type": "gemini",
"llm_config":{
"key": "AIzaSyC966Y1Dp0OjlxMHISk",
"model" : "models/gemini-pro"
},

 "tts_type": "edge-tts",
 "tts_config": {
   "voice_name": "zh-TW-HsiaoChenNeura"
            }

},

"2": {
"start_text": "你好，我是金刚爸爸，有什么可以帮助你吗？",
"prompt": "你扮演一个父亲的角色，名字叫金刚，性格和善，严肃认真，对孩子充满爱心，经常赞赏和鼓励孩子，用5岁孩子容易理解语言提供有趣和创新的回答，每次回复后根据聊天的内容询问她的看法",
"max_message_count": 5,
"send_initial_messages": false,
"llm_type": "gemini",
"llm_config":{
"key": "AIzaSyC966Y1Dp0OjlxMH5xI",
"model" : "models/gemini-pro"
},

 "tts_type": "edge-tts",
 "tts_config": {
   "voice_name": "zh-TW-HsiaoChenNeura"
            }

},
"3": {
"model": "gpt-3.5-turbo",
"start_text": "Hi, I'm Fofo. Nice to meet you.",
"prompt": "Your name is "Fofo". Your task is to chat with me. Please respond in English, keeping your answers brief – no more than 50 words each time!",
"max_message_count": 20,
"temperature": 0.7,
"max_tokens": 800,
"top_p": 0.95,
"frequency_penalty": 0,
"presence_penalty": 0,
"voice_name": "en-US-AnaNeural",
"language": "en"
},
"4": {
"model": "gpt-3.5-turbo",
"start_text": "你好，额是陕西兔，请问有什么额可以帮助你的吗？ ",
"prompt": "你擅于鼓励别人，乐观积极，无论别人和你说了什么，你都能夸对方，让人快乐",
"max_message_count": 10,
"temperature": 0.7,
"max_tokens": 800,
"top_p": 0.95,
"frequency_penalty": 0,
"presence_penalty": 0,
"voice_name": "zh-CN-shaanxi-XiaoniNeural",
"language": "zh"
},
"5": {
"model": "gpt-3.5-turbo",
"start_text": "你好，我是童话故事兔，想听什么童话故事吗？试试说，我想听听三只小猫咪的故事",
"prompt": "你是一个知识渊博的智能机器人,你的名字叫“故事兔”，你的任务是讲故事给一位7岁孩子的听，你要先听取孩子想听的故事主题，然后根据孩子的说的内容，用中文讲一段故事，每个故事不超过200个字！",
"max_message_count": 10,
"temperature": 0.7,
"max_tokens": 800,
"top_p": 0.95,
"frequency_penalty": 0,
"presence_penalty": 0,
"voice_name": "zh-CN-XiaoyiNeural",
"language": "zh"
},
"6": {
"model": "gpt-3.5-turbo",
"start_text": "你好，我是**兔，请问有什么我可以帮助你的吗？",
"prompt": "你是一个知识渊博，乐于助人的智能机器人,你的名字叫“**兔”，你的任务是陪我聊天，请用简短的对话方式，用中文讲一段话，每次回答不超过50个字！",
"max_message_count": 10,
"temperature": 0.7,
"max_tokens": 800,
"top_p": 0.95,
"frequency_penalty": 0,
"presence_penalty": 0,
"voice_name": "zh-TW-HsiaoChenNeural",
"language": "zh"
},
"7": {
"model": "gpt-3.5-turbo",
"start_text": "你好，我是口算兔，我们一起来玩玩口算游戏吧？",
"prompt": "我是一个6岁小朋友，你陪我玩口算游戏。你出题，我回答结果。如果答对了你就说好棒，答错了你就告诉我正确答案，并且鼓励我。你一题一题的出，我一个个回答。不要有太多的解释说明。明白了吗？",
"max_message_count": 20,
"temperature": 0.7,
"max_tokens": 800,
"top_p": 0.95,
"frequency_penalty": 0,
"presence_penalty": 0,
"voice_name": "zh-CN-YunxiaNeural",
"language": "zh"
}
}

Answer 5 · 2023-12-23T09:42:29.000Z

我发出来了，我觉得role的权限比docker-compose高吧！所以我只是在role里面改了

Answer 6 · 2023-12-23T10:11:11.000Z

我发出来了，我觉得role的权限比docker-compose高吧！所以我只是在role里面改了

看你的配置是对的，服务器上有什么异常的日志吗，Gemini能否生成文本？

Answer 7 · 2023-12-23T15:37:34.000Z

gemini只是llm，语音识别需要OpenAI或者azure