可爱的中文大语言模型训练流程图

一张柔和色调的中文教育海报，通过 8 个可爱的吉祥物场景，生动解释了大语言模型的训练流程，非常适合社交媒体科普或 AI 入门教学。
147 浏览来源：歸藏(guizang.ai)
#信息图 #海报 #横版 16:9 #动漫 #水彩手绘
Prompt (JSON)4360 字符
{
  "type": "可爱教育信息图海报",
  "topic": "{argument name=\"headline text\" default=\"大语言模型的训练过程\"}",
  "subtitle": "{argument name=\"subtitle text\" default=\"从海量数据中学习，变成\"超会聊天\"的小助手！\"}",
  "style": {
    "overall": "可爱的中文科普海报，柔和的课堂信息图风格，圆角面板，奶油色背景，手绘卡通美学，简洁的矢量插画，温暖友好的教育基调",
    "palette": [
      "奶油色",
      "薰衣草紫",
      "天蓝色",
      "薄荷绿",
      "黄橙色",
      "粉色",
      "柔棕色"
    ],
    "rendering": "高质量扁平化插画，带有细腻阴影，清晰的中文排版，贴纸风格装饰，小星星、爱心、箭头和对话气泡"
  },
  "layout": {
    "format": "横版海报",
    "grid": {
      "rows": 2,
      "columns": 4,
      "count": 8
    },
    "sections": [
      {
        "title": "1. 数据收集",
        "position": "左上角",
        "count": 1,
        "labels": [
          "网页",
          "新闻",
          "对话"
        ]
      },
      {
        "title": "2. 数据预处理",
        "position": "顶行，第二列",
        "count": 1,
        "labels": [
          "今天 天气 真不错!!",
          "今天|天气|真|不错!!"
        ]
      },
      {
        "title": "3. 预训练",
        "position": "顶行，第三列",
        "count": 1,
        "labels": [
          "今天气",
          "很好",
          "不错",
          "?",
          "......"
        ]
      },
      {
        "title": "4. 监督微调（SFT）",
        "position": "右上角",
        "count": 1,
        "labels": [
          "问：太阳为什么会发光？",
          "答：因为……",
          "好回答！"
        ]
      },
      {
        "title": "5. 奖励模型训练（RM）",
        "position": "底行，第一列",
        "count": 1,
        "labels": [
          "回答A 更好!",
          "回答B 一般般"
        ]
      },
      {
        "title": "6. 强化学习（RLHF）",
        "position": "底行，第二列",
        "count": 1,
        "labels": [
          "奖励 +1",
          "惩罚 -1"
        ]
      },
      {
        "title": "7. 评估与测试",
        "position": "底行，第三列",
        "count": 1,
        "labels": [
          "知识能力",
          "推理能力",
          "安全性",
          "稳定性"
        ]
      },
      {
        "title": "8. 部署与应用",
        "position": "右下角",
        "count": 1,
        "labels": [
          "聊天",
          "写代码",
          "写文章"
        ]
      }
    ],
    "topDecorations": {
      "count": 4,
      "items": [
        "左上角的小闪光",
        "标题周围的粉色纸屑",
        "右上角拿着星星魔杖的可爱白色吉祥物",
        "写着“冲鸭！”的对话气泡"
      ]
    },
    "bottomDecorations": {
      "count": 4,
      "items": [
        "左下角戴领结的白色小吉祥物",
        "包含 7 个圆角小方框和箭头的总结栏",
        "底部居中的结束语",
        "右下角带有鼓励文字和爱心的便利贴"
      ]
    }
  },
  "characters": {
    "main mascots": {
      "count": 4,
      "types": [
        "脸颊粉红的白色圆润小熊吉祥物",
        "带有深色面部屏幕和绿色天线的小圆机器人",
        "扎着马尾辫的人类老师女孩",
        "拿着放大镜的毛茸茸白色角色"
      ]
    },
    "recurring_robot_design": "矮小可爱的机器人，圆润的身体，浅绿色和奶油色外壳，深蓝色面部显示屏配有发光的眼睛，细小的四肢"
  },
  "sectionDetails": [
    {
      "title": "1. 数据收集",
      "panelColor": "薰衣草紫",
      "scene": "戴着紫色帽子的白色吉祥物坐在彩色书堆旁使用笔记本电脑；浮动的圆角标签代表互联网来源",
      "caption": "数据越多，知识越丰富！"
    },
    {
      "title": "2. 数据预处理",
      "panelColor": "天蓝色",
      "scene": "戴着蓝色帽子的吉祥物将散落的纸屑扫进桶里；杂乱的句子被转换成结构清晰的文本，并配有箭头",
      "caption": "把脏乱差，变得整整齐齐～"
    },
    {
      "title": "3. 预训练",
      "panelColor": "薄荷绿",
      "scene": "机器人阅读着一本打开的绿色书籍，周围的对话气泡显示简单的词元和回复，暗示语言学习过程",
      "caption": "像小朋友学习说话一样！"
    },
    {
      "title": "4. 监督微调（SFT）",
      "panelColor": "金黄色",
      "scene": "老师指着一张带标签的问答卡片，可爱的吉祥物在倾听；强调人工标注的高质量问答对",
      "caption": "老师带着学，回答更靠谱！"
    },
    {
      "title": "5. 奖励模型训练（RM）",
      "panelColor": "粉色",
      "scene": "机器人站在绿色对勾和红色叉号之间，对比两个答案选项，学习哪个更好",
      "caption": "学会\"挑好答案\"！"
    },
    {
      "title": "6. 强化学习（RLHF）",
      "panelColor": "薰衣草蓝",
      "scene": "机器人拿着工具，奖励项目显示带有箭头的正向和负向分数反馈",
      "caption": "鼓励好的，改掉不好的！"
    },
    {
      "title": "7. 评估与测试",
      "panelColor": "蓝色",
      "scene": "毛茸茸的白色考官角色拿着放大镜，站在带有四个绿色对勾的检查清单旁",
      "caption": "全方位体检，确保质量过关！"
    },
    {
      "title": "8. 部署与应用",
      "panelColor": "柔粉红色",
      "scene": "机器人周围出现了聊天、写作、代码和文档等应用图标，展示了实际部署场景",
      "caption": "正式上岗，陪你聊天写作啦！"
    }
  ],
  "bottomSummary": {
    "title": "总结一下：",
    "count": 7,
    "steps": [
      "数据收集 打好基础",
      "预处理 整理数据",
      "预训练 学知识",
      "监督微调 学会回答",
      "奖励模型 学会评判",
      "强化学习 对齐人类偏好",
      "评估测试 质量把关"
    ],
    "closingText": "{argument name=\"closing sentence\" default=\"这就是大语言模型从\"啥也不懂\"到\"超级学霸\"的成长之路！٩(๑^o^๑)۶\"}"
  },
  "language": "Simplified Chinese",
  "quality": "精美且适合社交媒体发布的信息图，布局平衡，中文文字清晰易读，风格迷人且极具分享价值"
}
查看原始来源