老师好:
在这小节视频中,讲解的关于“多轮对话功能,管理历史对话内容”的技术方案中我有2个问题想请教一下:
- 前端在构建完整的上下文消息数组(包含历史记录,例如最近的20条对话 + 当前用户消息)的技术方案中,这里是不是只是方便于demo讲解,如果是生产级别的项目,我理解是不是可以:前后端之间只传递会话id(session_id),然后构建完整的上下文消息数组的工作,放到后端来做,属于后端和大模型之间的工作,因为这些对话消息本身就是后端返回给前端的,不需要前端截取后再传给后端
- 对于在浏览器本地做消息对话的缓存,我没有理解这么做的目的是什么,是为了加载对话数据的速度能快一些吗?因为我使用了千问、元宝、豆包这些,我貌似没有在localstorage或者indexDB中看到缓存对话内容,所以想请教一下这里咱们课程中缓存的作用是为了什么解决什么问题(或者是为了带来什么优化)