当前位置:网站首页>2022清华暑校笔记之L1_NLP和Bigmodel基础
2022清华暑校笔记之L1_NLP和Bigmodel基础
2022-07-20 17:40:00 【鸭脖没了】
2022清华大学大模型交叉研讨课
2022-6-27
L1
1 NLP部分
- NLP Tasks
- 词性标注
- 命名实体的识别(省略的现象)
- 共体消减(代词)
- 标注成分之间的依赖关系
- 中文的自动分词
运用:
- 搜索引擎中运用NLP
- 匹配query和document的相似度,给定query后,可以给一些广告
- 判断文档质量
- NLP结合knowledge graph
- 充分抽取、利用知识
- 人工助手
- 翻译(解除语言屏障)
- 用语言作为一个视角,去分析社会
- 搜索引擎中运用NLP
词表示:
- 转化成机器可以理解的词的意思
- similarity和relation
- 弊端
- 人工标注,缺失一些新的含义
- 缺失细微的差别
- 主观性
- 数据吸收
- 需要大量人工
- 弊端
one-hot
- 独立的,找一维和该词对应,其余维度为0
- 默认词和词之间都是正交的,导致任意两个词之间的相似度都是0
- 改进:词义和上下文有关
- 一个词用它上下文的常见词进行表示
- 弊端:
- 增加了词的空间
- 对于出现频率较少的词,上下文比较稀疏,导致效果不好
word embedding
- 建立低维的向量空间
- Word2Vec
Language Model
- 语言建模,根据前文进行预测
- 联合概率:已有序列组成句子的概率
- 条件概率:根据已有的句子预测下一个词
- 如何完成?
- 假设:一个未来的词只受到之前的词的影响
- 可以拆分,得到联合概率和条件概率的关系
- 语言建模,根据前文进行预测
N-gram Model
- E.g, 4-gram(n-gram只和该词的前n-1个词有关)
P ( w j ∣ never to late to ) = count ( too late to w j ) count ( too late to ) P\left(w_{j} \mid \text { never to late to }\right)=\frac{\operatorname{count}\left(\text { too late to } w_{j}\right)}{\operatorname{count}(\text { too late to })} P(wj∣ never to late to )=count( too late to )count( too late to wj)
(never在此式子中并不纳入计算) - 弊端:
- 距离比较短
- 仍然没有考虑到词之间的相似度
- E.g, 4-gram(n-gram只和该词的前n-1个词有关)
Neural Language Model
- 分布式的表示来建构
- 先把前3个词都表示成低维的向量,然后把低维的向量拼在一起,形成一个高一些的向量,然后就可以用这个向量来预测下一个词。
- 所有的预测都是通过对上下文的表示来进行的。
- 通过大模型去学习参数的设置
2 Bigmodel
2.1 简介
预训练语言模型的机理和细节。
- Why PLM?
- 语言理解和语言生成的效果都很好
- 不断增加参数
- 增加计算
- 增加算力
- 例子:GPT-3
- rich knowledge
- zero/few-shot(无标注,少样本)
- 语言理解和语言生成的效果都很好
- Paradigms
- 从无标注的数据中进行学习,通过一些自监督的任务做预训练,从中得到丰富通用的知识。在具体运用的时候,再引入任务相关的知识,去调整模型。
- word embddings
- contextual word embddings
- ELMo,ULMFiT
- Transformer
- Typical Case
- GPT
- Bert
2.2 Demo
- 大模型demo
- GPT-3(问答模型)
- 代码大模型
- DALL-E 2 图像生成
- 搜素引擎
边栏推荐
猜你喜欢
LED数显驱动IC、抗干扰LED数码管显示驱动IC-VK1S68C SSOP24,适用指夹式脉搏血氧仪、臂式电子血压计、体温计、胎心仪、理疗仪、监护仪等,支持70/66/60/52点阵。
This should be done in the face of medical disputes
Systematic thinking and practice of data management of meituan accommodation business
Introduction to MySQL (a)
Quantum Source:致力于抢先实现百万光量子比特
UE5使用插件Quixel Bridge报错
那一年,春晚拓荒牛背后的故事
What kind of product is Jetson TX2 NX? (how Jetson TX2 NX provides powerful energy efficiency)
MySQL 啥时候用表锁,啥时候用行锁?
Regular expressions match all Chinese characters or characters with double quotation marks
随机推荐
Unhandled JS Exception: Unexpected identifier ‘_classCallCheck‘. import call expects exactly one arg
科技云报道:云巨头的中场战事:PaaS、SaaS成为关键破局点?
Spend 29million dollars! Israel establishes quantum computing research and Development Center
The 22 pictures show you in-depth analysis of prefix, infix, suffix expressions and expression evaluation
使用无公网IP: Port的数据库时候需要注意什么问题?
肝胆外科疾病,存在误诊和/或漏诊、误诊,医疗机构承担主要赔偿责任
绘图库Matplotlib安装配置
Go mod créer un projet
使用Unity Tilemap轻松制作2D瓦片地图-基础篇
什么是专线/VPN网关/智能接入网关的自建数据库?
2018MySQL技术问答集锦,希望能给喜欢MySQL的同学一些帮助
使用易语言开发一款远控软件
pyqt5使用QFile跟QDataStream进行二进制文件的读写
Exercice leetcode - Échange de doigts 66. Construire un tableau de produits
Quantum Source:致力于抢先实现百万光量子比特
Winform UI界面设计例程——获取电脑SN号
今日NFT/数字藏品热点
My creation anniversary (July 18, 2021 - July 18, 2022)
知识图谱 关系抽取有哪些方法
Huawei summer internship general software development experience