《Python自然语言处理》——1.7 深入阅读

1.7 深入阅读

本章综合介绍了有关编程、自然语言处理和语言学的新概念。其中的一些将会在下面的章节继续出现。然而,你可能也想咨询与本章相关的在线材料(在http://www.nltk.org/ ),包括额外的背景资料的链接及在线NLP系统的链接。你可能还喜欢在维基百科中阅读一些语言学和自然语言处理相关的概念(如搭配、图灵测试、类型-标识符的区别等)。

你应该自己去熟悉http://docs.python.org/ 上的Python文档,那里给出了许多教程和全面的参考材料。http://wiki.python.org/moin/BeginnersGuide 上有《Python初学者指南》。关于Python的各种问题在http://www.python.org/doc/faq/general/ 的FAQ中都有回答。

随着对NLTK研究的深入,你可能想订阅有关新版工具包的邮件列表。有了NLTK用户邮件列表,用户在学习如何使用Python和NLTK做语言分析工作时可以相互帮助。在http://www.nltk.org /中有这些列表的详情。

如果需要第1.5节所讲述的话题及NLP的相关信息,你可以阅读以下的优秀图书。

  • Indurkhya, Nitin和Fred Damerau(合编,2010)自然语言处理手册(Handbook of Natural Language Processing)(第二版),Chapman & Hall/CRC。
  • Jurafsky, Daniel和James Martin(2008)语音和语言处理(Speech and Language Processing)(第二版),Prentice Hall。
  • Mitkov, Ruslan(主编,2002年),牛津计算语言学手册(The Oxford Handbook of Computational Linguistics)。牛津大学出版社。

计算语言学协会(The Association for Computational Linguistics,ACL)是代表NLP领域的国际组织。ACL网站上有许多有用的资源,包括:有关国际和地区的会议及研讨会的信息;到数以百计有用资源的ACL Wiki链接;包含过去50年以来大多数NLP研究文献的ACL选集,里面的论文全部建立索引且可免费下载。

一些介绍语言学的优秀的教科书:(Finegan,2007),(O’Grady et al., 2004),(OSU,2007)。LanguageLog,是一个流行的语言学博客,其上会不定期发布一些本书中描述的技术应用。

时间: 2024-09-21 15:41:21

《Python自然语言处理》——1.7 深入阅读的相关文章

《Python自然语言处理》——第1章 语言处理与Python

第1章 语言处理与Python Python自然语言处理我们能够很容易地得到数百万数量级的文本.假设我们会写一些简单的程序,那可以用它来做些什么?本章将解决以下几个问题. (1)通过将技术性较简单的程序与大规模文本结合起来,我们能实现什么? (2)如何自动地提取出关键字和词组,用来总结文本的风格和内容? (3)Python编程语言为上述工作提供了哪些工具和技术? (4)自然语言处理中有哪些有趣的挑战呢? 本章分为风格完全不同的两部分.在1.1节,我们将进行一些与语言相关的编程练习而不去解释它们是

NLP1 —— Python自然语言处理环境搭建

最近开始研究自然语言处理了,所以准备好好学习一下,就跟着<Python自然语言处理>这本书,边学边整理吧 安装 Mac里面自带了python2.7,所以直接安装nltk就可以了. 默认执行sudo pip install -U nltk会报错: Collecting nltk Downloading nltk-3.2.4.tar.gz (1.2MB) 100% |████████████████████████████████| 1.2MB 555kB/s Collecting six (fr

《Python自然语言处理》——第1章 语言处理与Python 1.1 语言计算:文本和词汇

第1章 语言处理与Python 我们能够很容易地得到数百万数量级的文本.假设我们会写一些简单的程序,那可以用它来做些什么?本章将解决以下几个问题. (1)通过将技术性较简单的程序与大规模文本结合起来,我们能实现什么? (2)如何自动地提取出关键字和词组,用来总结文本的风格和内容? (3)Python编程语言为上述工作提供了哪些工具和技术? (4)自然语言处理中有哪些有趣的挑战呢? 本章分为风格完全不同的两部分.在1.1节,我们将进行一些与语言相关的编程练习而不去解释它们是如何实现的.在1.2节,

《Python自然语言处理》——导读

前 言 这是一本关于自然语言处理的书.所谓"自然语言",是指人们日常交流使用的语言,如英语.印地语.葡萄牙语等.相对于编程语言和数学符号这样的人工语言,自然语言随着一代代的传递而不断演化,因而很难用明确的规则来确定.从广义上讲,"自然语言处理"(Natural Language Processing,NLP)包含所有用计算机对自然语言进行的操作,从最简单的通过计数词汇出现的频率来比较不同的写作风格,到最复杂的完全"理解"人所说的话,或至少达到能对

可爱的Python:自然语言工具包入门

在本期文章中,David 向您介绍了自然语言工具包(Natural Language Toolkit),它是一个将学术语言技术应用于文本数据集的 Python 库.称为"文本处理"的程序设计是其基本功能:更深入的是专门用于研究自然语言的语法以及语义分析的能力. 鄙人并非见多识广,虽然写过很多关于 文本处理 方面的东西(例如,一本书),但是,对我来说, 语言处理(linguistic processing) 是一个相对新奇的领域.如果在对意义非凡的自然语言工具包(NLTK)的说明中出现了

《Python自然语言处理》——1.1 语言计算:文本和词汇

1.1 语言计算:文本和词汇 我们都对文本非常熟悉,因为我们每天都在进行阅读和写作.在本书中,把文本视为编写程序的原始数据,并通过很多有趣的编程方式来处理和分析文本.但在能写这些程序之前,必须得从了解Python解释器开始. Python入门 Python与用户友好交互的方式之一包括你可以在交互式解释器直接输入代码--解释器将运行你的Python代码的程序.你可以通过一个叫做交互式开发环境(Interactive Development Environment,IDLE)的简单图形接口来访问Py

《Python自然语言处理》——1.3 计算语言:简单的统计

1.3 计算语言:简单的统计 让我们重新开始探索利用计算资源处理大量文本的方法.在1.1节已经讨论了如何搜索文章中的词,如何汇编一个文本中的词汇,如何以相同的方式产生随机文本等. 在本节中,我们重新考虑怎样使一个文本显得与众不同的问题,并使用程序来自动寻找特征词汇和文本的表达方式.正如在1.1节中那样,可以通过把它们到复制Python解释器中来尝试Python语言的新特征,并将在下一节中系统地了解这些功能. 在这之前,你可能会想通过预测下面代码的输出来检验你对上一节的理解.你可以使用解释器来检查

《Python自然语言处理》——1.5 自动理解自然语言

1.5 自动理解自然语言 我们一直在各种文本和Python编程语言的帮助下自下而上地探索语言.然而,我们也对通过构建有用的语言技术,开拓语言和计算知识面的兴趣.现在,将借此机会从代码的细节中退出来,以描绘自然语言处理的全景图. 在纯应用层面上,我们都需要帮助才能在网络上的文本中找到有用的信息.搜索引擎在网络的发展和普及中发挥了关键作用,但也有一些缺点.它需要技能.知识和一点运气才能找到这样一些问题的答案:"我用有限的预算能参观费城和匹兹堡的哪些景点?","专家们怎么评论数码单

《Python自然语言处理》——1.2 近观Python:将文本当做词链表

1.2 近观Python:将文本当做词链表 大家已经学习过Python编程语言的一些重要元素.下面进行简单的系统复习. 链表 文本是什么?一方面,它是一页纸上的符号序列,就像这页纸一样.另一方面,它是章节的序列,每一章由小节序列组成,这些小节由段落序列组成,以此类推.然而,对于我们而言,认为文本不外乎是单词和标点符号的序列.下面是如何展示Python中<白鲸记>的开篇句. >>> sent1 = ['Call', 'me', 'Ishmael', '.'] >>&