一、准备工作
在调用实时语音合成API前需完成以下步骤:
- 注册腾讯云账号并通过实名认证
- 在控制台开通语音合成服务并领取免费资源包
- 获取API密钥三元组(AppID、SecretID、SecretKey)
ModelType | 适用场景 |
---|---|
1 | 标准音色 |
2 | 情感音色 |
二、配置鉴权参数
通过签名机制进行接口鉴权,需生成包含以下参数的请求头:
- Action: TextToStreamAudio
- SecretId: 密钥ID
- Timestamp: UNIX时间戳
- Expired: 签名有效期(不超过90天)
三、建立WebSocket连接
使用wss协议建立长连接,请求地址格式为:
wss://tts.cloud.tencent.com/stream_ws?Action=TextToStreamAudio&AppId=xxx
连接成功后按协议要求发送文本数据,单次请求支持最大600个汉字
四、处理合成结果
接口返回包含两种数据类型:
- 二进制音频流(支持PCM/MP3格式)
- JSON文本信息(包含状态码和会话ID)
建议通过状态码判断处理结果,异常时参考错误码说明进行排查
通过上述步骤可实现边合成边播放的实时语音效果。注意标准音色并发限制为20路,大模型音色限制10路,建议根据业务需求选择合适的音色类型
本文由阿里云优惠网发布。发布者:编辑员。禁止采集与转载行为,违者必究。出处:https://aliyunyh.com/554450.html
其原创性以及文中表达的观点和判断不代表本网站。如有问题,请联系客服处理。