NLP(Nature Language Processing,自然语言处理)是计算机学科及人工智能领域一个重要的子学科,它主要研究计算机如何处理、理解及应用人类语言。所谓自然语言,指人说的话、人写的文章,是人类在长期进化过程中形成的一套复杂的符号系统。

NLP概述

NLP的主要任务

主要可分为两大类:

  • 基于现有文本或语料的分析
  • 生成新的文本或语料

NLP发展历程

NLP的发展轨迹为:基于规则 → 基于统计 → 基于深度学习,其发展大致经历了4个阶段:

  • 1956年以前的萌芽期;
  • 1957~1970年的快速发展期;
  • 1971~1993年的低速发展期;
  • 1994年至今的复苏融合期。
    • 2001年:神经语言模型
    • 2008年:多任务学习
    • 2013年: Word嵌入
    • 2013年:NLP的神经网络
    • 2014年:序列到序列模型
    • 2015年:注意力机制
    • 2015年:基于记忆的神经网络
    • 2018年:预训练语言模型

NLP相关知识构成