2.7 Python中的可视化工具
数据分析和可视化需要一些软件工具:用一个文本编辑器来写代码(最好语法高亮),用Python和其他库来运行和测试代码,可能还要用一个工具展示这些结果。现有两种软件工具:通用的软件工具和特定软件组件。
开发工具
通用的软件工具是集成开发环境(integrated development environment,IDE),这是一种同一软件包内囊括所有生产工具的应用程序。从处理Python库的角度来看,这些IDE通常非常方便。有关IDE工具的更多细节将在下一章讨论。本章中,我们将简要介绍Enthought中的Canopy和Continuum Analytics中的Anaconda。
特定的软件绘图组件是Python绘图库,比如Bokeh、IPython、matplotlib、NetworkX、SciPy和NumPy、Scikit-learn以及Seaborn。IDE都能非常方便地处理增加、删除和更新这些绘图库的版本。
1. Enthought中的Canopy
在一些其他的库中,Enthought Canopy有一个在BSD-风格执照下发布的免费版本,而且以GraphCanvas、SciMath和Chaco为绘图工具。它有高级文本编辑器、集成IPython控制台、图表软件包管理器和在线文件链接。Canopy分析环节简化了数据分析、可视化、算法设计和面向科学家、工程师和分析师的应用开发环境。
2. Continuum Analytics中的Anaconda
Anaconda IDE以conda应用为基础。Conda是发现和访问软件包的一种应用。conda软件包是一个包括Python模块、可执行程序,或其他组件的二进制压缩包。Conda跟踪了软件包与平台细节间的依赖性,使得从其他组软件包中创建工作环境变得简单。
Anaconda带有sypder-app,一种科学的Python开发环境,该环境也有IPython查看器。除此之外,IPython可以由一个GUI或基于网络的笔记本发起。最方便的地方在于:你可以在主目录访问Python,而不用接触系统安装的Python。并非所有的软件包能用在Python 3中;因此,最好将这些IDE用在Python 2。
IPython(http://ipython.scipy.org/)提供了一个提高的、互动的Python shell,而且由于数据科学和可视化在本质上的互动性,它被极度推荐。大多数平台支持IPython。IPython还有其他一些特征:
标签完成:这涉及变量、函数、方法、属性和文件名的完成。标签完成是通过GNU Readline库(http://tiswww.case.edu/php/chet/readline/rltop.html)完成的。用完GNU Readline之后,很难回到常规的命令行界面。
命令历史功能:这是为充分考虑以前命令而发布的命令历史。