两种语言结构

为了能准确地解释自然语言,我们需要理解它的结构。

Context-free grammars (CFG)

也称为 Constituency 或者 phrase structure grammer。
image.png

Dependency structure

句子的依存结构展示了哪些词取决于(修饰)另外一些词。

  • 依赖关系: 单词之间的二元非对称关系
  • 依赖关系通常依据语法名称分类

    依存结构的表示

  • 用一个从 head 指向 dependent 的箭头表示依赖关系。
  • 可以用一个带箭头的句子或树来表示结构,一般会加一个 root 结点。 | 树形表示 | 箭头表示 | | —- | —- | | image.png | image.png |

数据标注

image.png

Projectivity vs non-projectivity

  • projectivity: 表示箭头之间没有交叉
  • non-projectivity: 箭头之间可以有交叉

    Dependency Parsing

    分析给定句子的语法依赖结构。

  • 构造一个从输入句子到句子的依赖树结构图的映射

  • 包括两个子任务:
    • 学习:给定带有标注的训练集,学习一个解析模型。
    • 解析:利用学到的解析模型解析新的句子
  • 通常有两个限制:

    • 只能由一个单词是 root 的 dependent
    • 不能构成环

      Methods of Dependency Parsing

  • Dynamic Programming

  • Graph algorithms
  • Constraint Satisfaction
  • “Transition-based parsing” or “deterministic dependency parsing”