有效沟通问答-【官方】百战程序员_IT在线教育培训机构

JAVA 全系列

Python 全系列

Python入门

Python 深入与提高

Hadoop 分布式文件系统：HDFS（扩展）

Hadoop 分布式计算框架：Mapreduce（扩展）

AIGC人工智能工具全能班

Stable Diffusion（自选模型）AI绘图

大厂算法特训班

C++特训班

大数据全系列

Hadoop 分布式计算MapReduce和资源管理Yarn

人工智能

人工智能基础-Python科学计算和可视化

深度学习-目标检测YOLO(V8正在更新中)实战

【加课】百度飞桨PaddlePaddle实战【新增】

【加课】Linux 环境编程基础

【加课】算法与数据结构

【加课】C++基础【新增】

【加课】计算机图形学/机器视觉实战【新增】

微服务

SpringBoot与MybatisPlus

租房网（Spring Cloud最新架构）

Spring Cloud Alibaba技术栈

软件测试全系列

Java编程基础和Java Web开发基础

7u职场软实力

毕设项目

计算机考研408

会员可以在此提问，百战程序员老师有问必答

对大家有帮助的问答会被标记为“推荐”
看完课程过来浏览一下别人提的问题，会帮你学得更全面

截止目前，同学们一共提了 128425个问题

时间排序推荐排序

老师好，我们需要的是Yi，不管是正向传播还是反向传播，红色圈起来的部分都不会对Yi有影响，看上去是不会影响结果的，那存在的意义是什么呢

人工智能/第十七阶段：深度学习-NLP自然语言处理原理和进阶/循环神经网络原理与优化 1楼

请问下图里面的Ot-1, Ot 是不是只输出了并不会参与后续计算，如果是的话为啥要输出呢

人工智能/第十七阶段：深度学习-NLP自然语言处理原理和进阶/循环神经网络原理与优化 2楼

老师好，这里提到了Xt是一个矩阵，是多条句子输入合并成的矩阵。请问Xt里面的不同句子在正向传播的过程中互相之间会有关联吗？如果有，如何理解RNN一次性学了多个句子然后还不被不同句子之间相互混淆缠绕呢？

人工智能/第十七阶段：深度学习-NLP自然语言处理原理和进阶/循环神经网络原理与优化 3楼

这个初始的w矩阵是怎么算的？

人工智能/第十七阶段：深度学习-NLP自然语言处理原理和进阶/词向量与词嵌入 4楼

老师，我想问下这个表中的概率值是怎么计算的呀，为什么他的概率之和不为1呀

人工智能/第十七阶段：深度学习-NLP自然语言处理原理和进阶/词向量与词嵌入 5楼

老师，在tf.nn.dunamic_nn中最后一时刻的输出为什么是相同的呀，向上传要经过v矩阵，向右要经过W矩阵，不会一样呀

人工智能/第十七阶段：深度学习-NLP自然语言处理原理和进阶/循环神经网络原理与优化 6楼

老师，我想问下CNN为什么说只能传入一个时刻的输入，我增大他的batch不就可以输入多个时刻了吗/

人工智能/第十七阶段：深度学习-NLP自然语言处理原理和进阶/循环神经网络原理与优化 7楼

老师，我想问下在NPLM中首先会把词变为一个长度为m的词向量，而词向量的参数又是随机给定的，既然是这样的话那为什么不直接随机一个长度为m的向量就可以，这么做岂不是多此一举吗？

人工智能/第十七阶段：深度学习-NLP自然语言处理原理和进阶/词向量与词嵌入 8楼

老师，这里不是调整W8参数吗？那求偏导不应该是L对W8求偏导吗？

人工智能/第十七阶段：深度学习-NLP自然语言处理原理和进阶/循环神经网络原理与优化 9楼

Decoder中Masked Attention经过Add&Normalization后的Q矩阵，和传过来Encoder的K、V矩阵应该怎么理解？

我的理解：

1)Q矩阵是当前词可能的匹配可能；

2)K表示该词和每个词的匹配程度；

3)V表示每个词的隐含信息；

4)K和V是在Encoder中直接获取，就不需要Decoder来计算了，所以从Encoder直接拿过来就可以。Q矩阵的话因为Decoder这边是单向的，只能从前面的算当前的，所以用Decoder自己的。(Encoder那边的Q矩阵是双向的，一个目标词的前后的词信息都在Encoder的Q矩阵中。)

这样理解合适么？

人工智能/第十七阶段：深度学习-NLP自然语言处理原理和进阶/从Attention机制到Transformer 10楼

这句话来自同一个序列怎么理解呢？

输入数据转成词向量的Embedding结果矩阵Ι模型持有一份，然后单头的self-attention中一组Wq、Wk、Wv对矩阵I进行计算，就是对同一份Encoder进行处理，和Encoder那边没有任何关系。可以这么理解么？

人工智能/第十七阶段：深度学习-NLP自然语言处理原理和进阶/从Attention机制到Transformer 11楼

请问一下，对一个文档里面的词进行one-hot encode的话构成的应该是个二维的数组吧？那对多个文档进行独热编码是不是三维的数组？望告知，多谢！

人工智能/第十七阶段：深度学习-NLP自然语言处理原理和进阶/词向量与词嵌入 12楼

蓝色部分不是输入么？输入也能被训练的么？

人工智能/第十七阶段：深度学习-NLP自然语言处理原理和进阶/词向量与词嵌入 13楼

这里的分子应该是2，而不是827吧？因为want先出，I在后面，所以个数是两个才对。求告知，多谢！

人工智能/第十七阶段：深度学习-NLP自然语言处理原理和进阶/词向量与词嵌入 14楼

求p（i|want）的概率的时候应该是先有want 再有i 对应表里的2，而不是等于p（want|i）先有i再有want 对应表里的827

人工智能/第十七阶段：深度学习-NLP自然语言处理原理和进阶/词向量与词嵌入 15楼

同学您好