第1章 语言处理与Python
Python自然语言处理
我们能够很容易地得到数百万数量级的文本。假设我们会写一些简单的程序,那可以用它来做些什么?本章将解决以下几个问题。
(1)通过将技术性较简单的程序与大规模文本结合起来,我们能实现什么?
(2)如何自动地提取出关键字和词组,用来总结文本的风格和内容?
(3)Python编程语言为上述工作提供了哪些工具和技术?
(4)自然语言处理中有哪些有趣的挑战呢?
本章分为风格完全不同的两部分。在1.1节,我们将进行一些与语言相关的编程练习而不去解释它们是如何实现的。在1.2节,我们将系统地回顾关键的编程概念。我们使用章节标题来区分这两种风格,而后面几章则不像前面一样,是将两种风格混合在一起,不作明显的区分。我们希望这种介绍风格能使你对将要出现的内容有一个真实的体会,与此同时,介绍中还涵盖了语言学与计算机科学的基本概念。如果你对这两个方面已经有了基本的了解,可以直接从1.5节开始学习。我们将在后续的章节中重复所有要点,如果错过了什么,你可以很容易地查询在线参考材料。如果这些材料对你而言是全新的,那么本章所提出的问题比它还要多,这些问题将在本书的其余部分中进行讨论。
时间: 2024-10-16 19:17:38