0%

什么是NLP中的文本摘要

自动文本摘要是在保持关键信息内容和整体含义的同时,生成简洁流畅的摘要的任务。
文本摘要目前大致可以分为抽取式与生成式两种类型:

  1. Extractive Summarization:根据词语重要性、句子重要性排序,抽取出重要度高的句子,从而形成摘要。主要是对文本的选择,算法过程相对更容易,但是对于复杂的文本时,很难仅仅通过选择文本来形成摘要,如小说。
  2. Abstractive Summarization:过程更为复杂,但生成能力更强,可认为有一定的概括能力。
阅读全文 »

前言

这篇文章解释了CNN是怎么学到图片内的绝对位置信息。探究了CNN到底有没有编码位置信息,这些位置信息在哪些神经元中被编码、这些位置信息又是如何被暴露给神经网络学习的。

阅读全文 »

滤波器与通带与阻带

工程上根据输出端口对信号频率范围的要求,设计专门的网络,置于输入-输出端口之间,使输出端口所需要的频率分量能够顺利通过,而抑制不需要的频率分量,这种具有选频功能的中间网络,工程上称为滤波器。通常将希望保留的频率范围称为通带,将希望抑制的频率范围称为阻带

阅读全文 »

什么是图像

  1. 图:物体透射或反射光的分布,是客观存在的。
  2. 像:人对图的印像或认识,是人的感觉。
  3. 图像:是图和像的有机结合,既反映物体的客观存在,又体现人的心理因素;是客观对象的一种可视化表示,它包含了被描述对象的有关信息。
阅读全文 »

问题简介

半导体制造是按照整盒晶圆为单位进行生产。因此大致同一盒晶圆在生产上基本上是同一时间经过各个工艺步骤,因而可以说同一盒晶圆中的所有单片晶圆所经历的生产环境是一致的。但是,由于单片晶圆所经历的机台子工艺仓可能不同,就有可能造成一盒晶圆中的单片晶圆按照一定顺序重复失效;例如所有奇数片低良率,偶数片正常。所以,这时不仅需要分析以整盒晶圆为单位的叠图失效图形,还要具体分析每片晶圆的失效图形。

阅读全文 »

简介: 在总体分布任意的情形下,检验配对的试验数据所在总体的分布位置有无显著差异,往往可以利用符号检验的方法实现。但是符号检验只考虑差数的正负号,而不考虑差数的绝对值差异,会导致部分试验信息损失,结果较为粗略。为了避免符号检验方法的这一缺陷,Wilcoxon提出了一种改进方法,称为Wilcoxon秩和检验(rank sum test)。这种方法同时考虑了差异的方向和差异的大小,较之符号检验更为有效。而对于成组的试验数据所在总体的分布位置有无差异,也可以采用类似的方法进行检验。秩和检验(rank sum test)又称顺序和检验,它是一种非参数检验(nonparametric test)。非参数检验不依赖于总体分布的具体形式,应用时可以不考虑被研究对象为何种分布以及分布是否以知,因而实用性较强。

阅读全文 »