关于收录现实中文版ChatGPT的各种技术路线,数据及其他资料
2 E币
成为会员,免费下载资料
文件大小:403.01 KB
上传者:海拥
时间:2023-05-06 14:09:28
下载量:0
BELLE指令微调数据集(1.5M)
BELLE10M中文数据集, 包含0.25M数学指令数据集和0.8M多轮任务对讲数据集
InstructionWild : Colossal AI 收集的中英文双语数据集(104K)
GPT-4-LLM : GPT-4标注的中英文双语指令微调数据,提示来自Stanford Alpaca。
ShareGPT : ChatGPT用户分享的聊天数据,大部分分为英文数据,插件维护者目标之前已经关闭了公共获取数据的接口。
CAMEL : 对话式指令跟随数据集,并将英文数据翻译到10种包含中文的不同语言。
OASST1 : OpenAssistant Conversations,一个人工生成的、人工注解的协助式对话资料库,由 35 种不同语言的 161,443 条消息组合而成。包含少量中文语料。
展开》
折叠》