AI技术干货|从头开始图解大语言模型(下篇)
在阅读本文前,有几个热身的问题,您尝试回答一下。
(相关资料图)
1. 什么是大语言模型(LLM)?
2. 大语言模型开发与传统机器学习开发有什么区别?
3. 什么是任务特定模型?
4. 什么是大语言模型的微调和参数有效调整?
5. 如何理解大语言模型的一体多用特性?
下面就让我们开启探讨大语言模型奥秘之旅。
前文回顾:
AI技术干货|从头开始图解大语言模型(上篇)
AI技术干货|从头开始图解大语言模型(中篇)
引言
深度学习的子领域中有两个重要的概念:大型语言模型(LLMs)和生成式人工智能(Generative AI)。这两者在许多方面都有交集,并且都属于深度学习的研究范畴。如果您对生成式人工智能感兴趣,建议您阅读金博士的《生成式人工智能简介》一文。
在过去的几年中,生成式人工智能发展迅速,吸引了大量的关注。这种类型的人工智能能够生成全新的内容,包括文本、图像、音频和合成数据。
本文我们探讨一下什么是大型语言模型。这类模型预先通过大量的文本数据进行训练,通常是从互联网或其他公开可获取的书籍中提取的。预训练期间,模型学习并理解文本数据的模式和结构。之后,在微调阶段,模型会根据特定的任务进行优化,这些任务可能包括机器翻译、文本生成、情感分析等。
下面我们通过几个通俗易懂的示例,逐步对大模型的工作机理展开进行讲解,希望能够让更多的读者掌握相关的背景知识。
前文回顾;
AI技术干货|从头开始图解大语言模型(上篇)
AI技术干货|从头开始图解大语言模型(中篇)
大语言模型的定义和特征
大语言模型的特征
大型语言模型的一个显著特性是它们的“多任务”能力,即一个模型能适应并完成各种不同的任务。这种特性使得大型语言模型在诸多领域中具有巨大的应用价值,例如:聊天机器人、内容生成、自然语言理解和生成等,任何涉及理解和生成文本的场景,它们都能大显身手。
那么“预训练”和“微调”到底是什么含义呢?试想一下训练一只狗。通常,你会训练你的狗学习基本的命令,比如“坐下”,“过来”,“趴下”,和“停”。这些命令在日常生活中通常就足够用了,能够帮助你的狗成为一个良好的宠物公民。然而,如果你需要特殊的服务犬,比如警犬、导盲犬或者猎犬,你就需要给它进行额外的特殊训练。
这个思路同样适用于大型语言模型。这些模型进行通用目的的训练,来解决常见的语言问题,如文本分类、问题回答、文档摘要和跨行业的文本生成等。然后,这些模型可以根据不同领域,如零售、金融和娱乐等,利用相对较小规模的领域数据集,进行微调,解决特定的问题。
这个过程中的“预训练”阶段,就相当于教狗狗基本的命令。而“微调”阶段,则对应于对狗狗进行特殊的额外训练。预训练的模型就像一只已经学会基本命令的狗,能够进行基本的任务;而经过微调后的模型,则像是一个专门训练过的服务犬,可以完成更特定、更复杂的任务。
让我们进一步将大型语言模型的概念分解为三个主要特征。
1. “大型”有两个含义。首先,它表示训练数据集的巨大规模,有时达到PB(petabyte,即千兆字节)级别。其次,它指的是参数的数量。在机器学习中,参数通常被称为超参数。参数基本上是机器从模型训练中学到的记忆和知识。参数决定了一个模型在解决问题(如预测文本)时的技能水平。
2. “通用目的”意味着这些模型足以解决常见问题。有两个原因导致了这个观点。首先,无论具体任务是什么,人类语言都有其通用性。其次,资源是有限的。只有某些组织有能力使用巨大的数据集和大量的参数来训练这种大型语言模型。
3. “预训练”和“微调”,即在有能力的组织为他人创建基础语言模型之后,用户使用大规模数据集为通用目的预训练一个大型语言模型,然后使用一个小得多的数据集为特定目标微调它。
在这个框架下,你可以将大型语言模型看作是一个强大的、高度适应性的工具。它们被设计为可以处理各种不同的语言任务,并且可以根据需要进行调整和优化,以满足特定的需求。而这一切,都是基于大规模数据集的预训练和精细的微调实现的,这是大型语言模型的核心思想和主要优势所在。
大语言模型的分类
标签:
推荐文章
- 打完新冠疫苗需要注意什么忌口?疫苗第四针加强针有必要打吗?
- 鲜切花扮靓产业振兴路!每年可实现总产值800余万元
- 研究人员最新发现 单个细胞可同时处理成百上千个信号
- 陆军第73集团军某旅 创新升级模拟训练器材
- 长期暴露在光照下性能退化 科学家发现钙钛矿太阳能电池最大缺陷
- 宁夏启动双百科技支撑行动 构建高水平产业创新体系
- 陆军炮兵防空兵学院 毕业学员综合战术演习现地备课工作圆满完成
- 国内首颗以茶叶冠名遥感卫星 安溪铁观音一号发射成功
- 区域特色产业转型升级 四川屏山以“3+”模式推进科技创新工作
- 激发创新动能促进产业发展 无锡滨湖走出产业转型“绿色”路
- 绥化全域低风险!黑龙江绥化北林区一地调整为低风险
- 走访抗美援朝纪念馆:长津湖的寒冷,与战斗一样残酷
- 节后第一天北京白天晴或多云利于出行 夜间起秋雨或再上线
- 走近网瘾少年们:他们沉迷网络的病根何在?
- “双减”后首个长假:亲子游、研学游需求集中释放
- 获2021年诺奖的蛋白,结构由中国学者率先解析
- 他从一窍不通的“门外汉”,到重装空投“兵专家”
- 升旗、巡岛、护航标、写日志,他们一生守护一座岛
- 中国故事丨“沉浸式”盘点今年的教育好声音!
- 农业农村部:确保秋粮丰收到手、明年夏季粮油播种
- “双减”出台两个月,组合拳如何直击减负难点?
- 《山海情》里“凌教授”的巨菌草丰收啦
- 且看新疆展新颜
- 天山脚下,触摸丝路发展新脉动
- 160万骑手疑似“被个体户”?平台不能当甩手掌柜
- 网游新政下,未成年人防沉迷的“主战场”在哪?
- “辱华车贴”商家及客服被行拘,处罚要不放过每一环
- 沙害是自然界的恶魔,而他是荒沙碱滩的征服者
- 面对婚姻,“互联网世代”的年轻人在忧虑什么?
- IP类城市缘何吸引力强?玩法创新带动游客年轻化
- 国庆主题花坛持续展摆至重阳节
- 都市小资还是潮流乐享?花草茶市场呈爆发性增长
- 从1.3万元降到700元,起诉书揭秘心脏支架“玄机”
- 北京国庆7天接待游客超861万人次 冬奥线路受青睐
- 陈毅元帅长子忆父亲叮嘱:你们自己学习要好,就可以做很多事儿
- 报告显示:这个国庆假期,粤川浙桂赣旅游热度最高
- 中国科技人才大数据:广东总量第一,“北上”这类人才多
- 嘉陵江出现有记录以来最强秋汛
- 全国模范法官周淑琴:为乡村群众点燃法治明灯
- 线上教学模式被盯上,网络付费刷课形成灰色产业链
- 云南保山:170公里边境线,4000余人日夜值守
- 警方查处故宫周边各类违法人员12人
- 农业农村部:确保秋粮丰收到手、明年夏季粮油播种
- 受南海热带低压影响 海南海口三港预计停运将持续到10日白天
- 多地网友投诉遭遇旅游消费骗局,呼吁有关部门严查乱象
- 神经科学“罗塞塔石碑”来了:迄今为止最完整的大脑细胞图谱
- 汾河新绛段发生决口
- 陕西支援14省份采暖季保供用煤3900万吨
- 这场红色故事“云比拼”,穿越时空为我们指引方向
- 受琼州海峡封航影响 10月7日、8日进出海南岛旅客列车停运
- 辽宁省工信厅发布10月8日电力缺口橙色预警
- 广州10月8日至20日对所有从省外来(返)穗人员实施核酸检测
- 假期怎么过得这么快?国庆5.15亿人次出游,你咋过的?
- 国庆假期全国道路交通总体安全平稳有序
- 哈尔滨市南岗区爱达88小区将调整为低风险地区
- 新疆霍尔果斯市2例无症状感染者新冠病毒均为德尔塔变异株
- 百闻不如一见——北京大学留学生参访新疆
- 看,生机勃勃的中国
- 国庆假期中国预计发送旅客4.03亿人次
- 新疆兵团可克达拉市:195名密接者已全部隔离医学观察
- 山西平遥消防4天29次救援:拖着腿走路也要完成任务
- 国庆假期北京接待游客861.1万人次
- 冷空气自西向东影响中国大部地区 气温将下降4℃至6℃
- 新疆哈密市巴里坤县发生4.3级地震 震源深度9千米
- 国庆假期中国国内旅游出游5.15亿人次
- 公安部交管局:国庆假期日均出动警力18万余人次,5位交警辅警牺牲
- 受南海热带低压影响广东将暂别高温天气
- “数说”杭州无障碍改造:触摸城市“爱的厚度”
- 新疆霍尔果斯无症状感染者新冠病毒属德尔塔变异株 未发现高度同源的基因组序列
- 新疆伊犁州:妥善做好滞留旅客安置返回工作
- 国庆假期广西累计接待游客逾3611万人次 实现旅游消费272.41亿元
- 2021年MAGIC3上海市青少年三对三超级篮球赛落幕
- 新疆兵团第四师可克达拉市1名无症状感染者为餐饮从业人员
- 哥伦比亚遇上广州:洋茶人“云上”喫茶 传播中国茶“味道”
- 厦门同安区四区域调整为低风险 全市无中高风险地区
- 直径2米“面气球”亮相 山西首届“寿阳味道”美食大赛启幕
- 世界第一埋深高速公路隧道大峡谷隧道出口端斜井掘进完成
- 浙南沿海村村发展有妙招 搭乘共富快车打造“海上花园”
- 新疆霍尔果斯两例无症状感染者新冠病毒均属德尔塔变异株
- 南沙港铁路国庆假期不停工 力争今年年底开通
- 添加陌生人为好友 内蒙古两女子被骗126万
- 中国国庆假期出行热:数字改变“关键小事”
- 水能载物亦能“生金” 浙江遂昌山村以水为媒奔共富
- 铁路人国庆雨中巡查排险记:一身雨衣、一把铁锹保安全畅通
- 铁路迎返程高峰 西安局集团公司加开79趟高铁列车
- 受热带低压影响 琼州海峡北岸等待过海车辆排长龙
- 哈尔滨市学校有序恢复线下教学
- 哈尔滨一地风险等级调整为低风险
- 从进“培训班”到看《长津湖》
- 安徽黄山国庆假期迎客12万余人 旅游市场稳步复苏
- 山西解除持续近90小时的暴雨四级应急响应
- 科学拦峰错峰削峰 嘉陵江洪水过境重庆中心城区“有惊无险”
- 粤高速大湾区路段假期车流集中 跨珠江口通道尤甚
- 千年街区“非遗”风催热国庆假期本地游
X 关闭
资讯
X 关闭
行业动态
-
北京110与12345“一键通” 基层110接处警工作纳入执法质量监督考核
- 北京110与12345“一键通” 基层110接处警工作纳入执法质量监督考核
- 全球微速讯:广州南沙力争2025年打造万亿级先进制造业产业集群
- 鑫磊股份: 首次公开发行股票并在创业板上市网上申购情况及中签率公告|全球热讯
- 吉林省造老银元价格(2023年01月10日)
- 全球热消息:成都保租房申请方式
- 湖北三条高速公路同时开通运营
- 五芳斋董秘回复:感谢您对公司的宝贵建议,公司注重产品研发创新-环球快讯
- 平安惠普贷款逾期16天不还会影响征信吗
- 大众经典“迷你巴士”电动款将迎中南首秀
- 沃森生物:公司与蓝鹊生物合作开发的新冠变异株mRNA疫苗(S蛋白嵌合体)在目前已完成7个地点的入组工作