文章把用户使用社交媒体的原因归结为搜寻知识、找乐子和基础性任务等三种。
基于此,把LLM应用在社交媒体的任务抽象为了:
当然,挑战也有很多,总结了三点:
1.上面的三大任务,现在的llm都没有训练过
2.社交媒体是动态实时的,llm是静态的
3.llm输出内容的评估,安全性等
最后分别针对这三个任务的三点挑战,分别给出了解决方案:
1.对于知识任务:使用RAG检索与问题相关的社交媒体帖子和评论,得益于RAG的扩展性和动态性,解决了前两个问题。
针对LLM对一些错误的内容误导产生错误的回复,采用了fine-tuing方式(Ouyang, L., Wu, J., Jiang, X., Almeida, D., Wainwright, C., Mishkin, P., Zhang, C., Agarwal, S., Slama, K., Ray, A., et al. (2022). Training language models to follow instructions with human feedback. Advances in Neural Information Processing Systems, 35:27730–27744.)
2.对于娱乐任务:应用一个奖励模型预测用户的交互行为。同时使用周期性的奖励模型来应对第二个挑战。
源论文:
https://arxiv.org/abs/2401.02575