Prompt (JSON)4360 字符
{
"type": "可爱教育信息图海报",
"topic": "{argument name=\"headline text\" default=\"大语言模型的训练过程\"}",
"subtitle": "{argument name=\"subtitle text\" default=\"从海量数据中学习,变成\"超会聊天\"的小助手!\"}",
"style": {
"overall": "可爱的中文科普海报,柔和的课堂信息图风格,圆角面板,奶油色背景,手绘卡通美学,简洁的矢量插画,温暖友好的教育基调",
"palette": [
"奶油色",
"薰衣草紫",
"天蓝色",
"薄荷绿",
"黄橙色",
"粉色",
"柔棕色"
],
"rendering": "高质量扁平化插画,带有细腻阴影,清晰的中文排版,贴纸风格装饰,小星星、爱心、箭头和对话气泡"
},
"layout": {
"format": "横版海报",
"grid": {
"rows": 2,
"columns": 4,
"count": 8
},
"sections": [
{
"title": "1. 数据收集",
"position": "左上角",
"count": 1,
"labels": [
"网页",
"新闻",
"对话"
]
},
{
"title": "2. 数据预处理",
"position": "顶行,第二列",
"count": 1,
"labels": [
"今天 天气 真不错!!",
"今天|天气|真|不错!!"
]
},
{
"title": "3. 预训练",
"position": "顶行,第三列",
"count": 1,
"labels": [
"今天气",
"很好",
"不错",
"?",
"......"
]
},
{
"title": "4. 监督微调(SFT)",
"position": "右上角",
"count": 1,
"labels": [
"问:太阳为什么会发光?",
"答:因为……",
"好回答!"
]
},
{
"title": "5. 奖励模型训练(RM)",
"position": "底行,第一列",
"count": 1,
"labels": [
"回答A 更好!",
"回答B 一般般"
]
},
{
"title": "6. 强化学习(RLHF)",
"position": "底行,第二列",
"count": 1,
"labels": [
"奖励 +1",
"惩罚 -1"
]
},
{
"title": "7. 评估与测试",
"position": "底行,第三列",
"count": 1,
"labels": [
"知识能力",
"推理能力",
"安全性",
"稳定性"
]
},
{
"title": "8. 部署与应用",
"position": "右下角",
"count": 1,
"labels": [
"聊天",
"写代码",
"写文章"
]
}
],
"topDecorations": {
"count": 4,
"items": [
"左上角的小闪光",
"标题周围的粉色纸屑",
"右上角拿着星星魔杖的可爱白色吉祥物",
"写着“冲鸭!”的对话气泡"
]
},
"bottomDecorations": {
"count": 4,
"items": [
"左下角戴领结的白色小吉祥物",
"包含 7 个圆角小方框和箭头的总结栏",
"底部居中的结束语",
"右下角带有鼓励文字和爱心的便利贴"
]
}
},
"characters": {
"main mascots": {
"count": 4,
"types": [
"脸颊粉红的白色圆润小熊吉祥物",
"带有深色面部屏幕和绿色天线的小圆机器人",
"扎着马尾辫的人类老师女孩",
"拿着放大镜的毛茸茸白色角色"
]
},
"recurring_robot_design": "矮小可爱的机器人,圆润的身体,浅绿色和奶油色外壳,深蓝色面部显示屏配有发光的眼睛,细小的四肢"
},
"sectionDetails": [
{
"title": "1. 数据收集",
"panelColor": "薰衣草紫",
"scene": "戴着紫色帽子的白色吉祥物坐在彩色书堆旁使用笔记本电脑;浮动的圆角标签代表互联网来源",
"caption": "数据越多,知识越丰富!"
},
{
"title": "2. 数据预处理",
"panelColor": "天蓝色",
"scene": "戴着蓝色帽子的吉祥物将散落的纸屑扫进桶里;杂乱的句子被转换成结构清晰的文本,并配有箭头",
"caption": "把脏乱差,变得整整齐齐~"
},
{
"title": "3. 预训练",
"panelColor": "薄荷绿",
"scene": "机器人阅读着一本打开的绿色书籍,周围的对话气泡显示简单的词元和回复,暗示语言学习过程",
"caption": "像小朋友学习说话一样!"
},
{
"title": "4. 监督微调(SFT)",
"panelColor": "金黄色",
"scene": "老师指着一张带标签的问答卡片,可爱的吉祥物在倾听;强调人工标注的高质量问答对",
"caption": "老师带着学,回答更靠谱!"
},
{
"title": "5. 奖励模型训练(RM)",
"panelColor": "粉色",
"scene": "机器人站在绿色对勾和红色叉号之间,对比两个答案选项,学习哪个更好",
"caption": "学会\"挑好答案\"!"
},
{
"title": "6. 强化学习(RLHF)",
"panelColor": "薰衣草蓝",
"scene": "机器人拿着工具,奖励项目显示带有箭头的正向和负向分数反馈",
"caption": "鼓励好的,改掉不好的!"
},
{
"title": "7. 评估与测试",
"panelColor": "蓝色",
"scene": "毛茸茸的白色考官角色拿着放大镜,站在带有四个绿色对勾的检查清单旁",
"caption": "全方位体检,确保质量过关!"
},
{
"title": "8. 部署与应用",
"panelColor": "柔粉红色",
"scene": "机器人周围出现了聊天、写作、代码和文档等应用图标,展示了实际部署场景",
"caption": "正式上岗,陪你聊天写作啦!"
}
],
"bottomSummary": {
"title": "总结一下:",
"count": 7,
"steps": [
"数据收集 打好基础",
"预处理 整理数据",
"预训练 学知识",
"监督微调 学会回答",
"奖励模型 学会评判",
"强化学习 对齐人类偏好",
"评估测试 质量把关"
],
"closingText": "{argument name=\"closing sentence\" default=\"这就是大语言模型从\"啥也不懂\"到\"超级学霸\"的成长之路!٩(๑^o^๑)۶\"}"
},
"language": "Simplified Chinese",
"quality": "精美且适合社交媒体发布的信息图,布局平衡,中文文字清晰易读,风格迷人且极具分享价值"
}