博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
deeplearning.ai - 序列模型和注意力机制
阅读量:4089 次
发布时间:2019-05-25

本文共 1546 字,大约阅读时间需要 5 分钟。

吴恩达 Andrew Ng

Sequence models & Attention mechanism

Various sequence to sequence architectures

Basic Models

  • sequence to sequence model
  • image captioning 图像描述

Picking the most likely sentence

  • condition language model

    这里写图片描述

  • just pick one word at a time (greedy search) is not always optimal

  • approximate search algorithm

Beam Search 集束搜索

  • coalition 编码,decodlition 解码

  • beam width (B)集束宽,候选词的个数

  • record top B possiblities of sentences

  • 步骤
    这里写图片描述
    这里写图片描述
    这里写图片描述
  • 1TαyTyy=1logP(y<t>|x,y<1>,,y<t1>) 1 T y α ∑ y = 1 T y log ⁡ P ( y < t > | x , y < 1 > , ⋯ , y < t − 1 > )

    • length normalization 长度归一化

      这里写图片描述

    • numerical underflow 数值下溢,rounding error 四舍五入的误差

    • α α 是超参数

    • normalized log likelihood objective 归一化的对数似然目标函数

  • large B: better result but computationally slower

  • small B: worse result but faster

  • Beam Search is not guaranteed to find exact maximum for argmaxyP(y|x) a r g max y P ( y | x )

Bleu Score (optional)

  • give a score to measure how good is the machine translation
  • Bleu score on unigrams (一元词组), bigrams (二元词组)
  • BP: brevity penalty 简短惩罚
  • single real number evaluation metric 单一实数评估指标

Attention Model Intuition (注意力模型)

  • 神经网络很难记忆长句子

  • 一部分一部分来机器翻译

  • 这里写图片描述

Attention Model

这里写图片描述

Speech recognition - Audio data

Speech recognition

  • ​false blank outputs 伪空白输出

  • phonemes, hand-engineered basic units of cells

  • end-to-end network, input an audio clip and directly output a transcript

  • Connectionist Temporal Classification cost function

    collapse repeated characters not separated by “blank”

Trigger Word Detection 触发字检测

label​

这里写图片描述

Conclusion

Conclusion and thank you

Make the world a better place.​

你可能感兴趣的文章
串级 PID 为什么外环输出是内环的期望?(和我之前对串级PID的总结一样)
查看>>
我刚刚才完全清楚GPS模块的那根杆子是怎么固定安装好的
查看>>
去github里面找找也没有别人无人机+SLAM的工程
查看>>
PX4与ROS关系以及仿真控制(键盘控制无人机)
查看>>
我对无人机重心高度的理解
查看>>
现在明白为什么无名博客里好几篇文章在讲传感器的滞后
查看>>
实际我看Pixhawk定高模式其实也是飞得很稳,飘得也不厉害
查看>>
Pixhawk解锁常见错误
查看>>
C++的模板化等等的确实比C用起来方便多了
查看>>
ROS是不是可以理解成一个虚拟机,就是操作系统之上的操作系统
查看>>
用STL algorithm轻松解决几道算法面试题
查看>>
ACfly之所以不怕炸机因为它觉得某个传感器数据不安全就立马不用了
查看>>
我发觉,不管是弄ROS OPENCV T265二次开发 SDK开发 caffe PX4 都是用的C++
查看>>
ROS的安装(包含文字和视频教程,我的ROS安装教程以这篇为准)
查看>>
国内有个码云,gitee
查看>>
原来我之前一直用的APM固件....现在很多东西明白了。
查看>>
realsense-ros里里程计相关代码
查看>>
似乎写个ROS功能包并不难,你会订阅话题发布话题,加点逻辑处理,就可以写一些基础的ROS功能包了。
查看>>
if __name__ == ‘__main__‘:就是Python里的main函数,脚本从这里开始执行,如果没有main函数则从上到下顺序执行。
查看>>
PX4官方用户和开发手册的首页面是会给你选择英文和中文的
查看>>