PostgreSQL实实在在的选择

[摘要]数据库系统有很多,自由软件的数据库PostgreSQL是一种特性非常齐全的自由软件的对象---关系性数据库管理系统(ORDBMS),它的很多特性正是当今许多商业数据库的前身。在Linux系统大受欢迎的时候,PostgreSQL数据库系统也是一种高效稳定数据库系统,适合你的需求。

 最近一年多来,linux的普及速度在加快,在各个论坛中的linux板块的讨论也很火,Linux+Apache+PHP+MySQL的组合使得MySQL数据库很火。其实在数据库领域还有一个功能更为强大数据库PostgreSQL.

PostgreSQL 是一种非常复杂的对象-关系型数据库管理系统(ORDBMS), 也是目前功能最强大,特性最丰富和最复杂的自由软件数据库系统。有些特性甚至连商业数据库都不具备。

这个起源于伯克利(BSD)的数据库研究计划目前已经衍生成一项国际开发项目, 并且有非常广泛的用户。

PostgreSQL 可以说是最富特色的自由数据库管理系统,甚至我们也可以说是最强大的自由软件数据库管理系统。事实上,PostgreSQL 的特性覆盖了 SQL-2/SQL-92 和 SQL-3/SQL-99,首先,它包括了可以说是目前世界上最丰富的数据类型的支持,其中有些数据类型可以说连商业数据库都不具备,比如 IP 类型和几何类型等;其次,PostgreSQL 是全功能的自由软件数据库,很长时间以来,PostgreSQL 是唯一支持事务、子查询、多版本并行控制系统、数据完整性
检查等特性的唯一的一种自由软件的数据库管理系统。直到最近才有 Inprise 的 InterBase 以及 SAP 等厂商将其原先专有软件开放为自由软件之后才打破了这个唯一。

1、安装
自然,在你想开始使用PostgreSQL之前,你必须安装它.PostgreSQL很有可能已经安装到你的机器上了,因为它包含在你的操作系统的发行里,或者是系统管理员已经安装了它.Linux系统如RedHat、TurboLinux在安装的时候选择安装数据库系统,则已经安装好了PostgreSQL,如果是这样的话,那么你应该从操作系统的文档或者你的系统管理员那里获取如何访问 PostgreSQL 的信息.
如果你不清楚PostgreSQL是否已经安装,或者不知道你能否用它(已经安装的)做自己的实验,那么你就可以自己安装.这么做并不难,并且是一次很好的练习.PostgreSQL可以由任何非特权用户安装,并不需要超级用户(root)的权限. 
如果你准备自己安装 PostgreSQL,那么请参考管理员手册(这里有中文文档)获取安装的有关信息,安装之后再回到这个指导手册来.一定要记住要尽可能遵循有关设置合适的环境变量的章节里的信息.

如果你的机器管理员没有按照缺省的方式设置各项相关参数,那你还有点额外的活儿要干.比如,如果数据库服务器机器是一个远程的机器,那你就需要把PGHOST环境变量设置为数据库服务器那台机器的名字.环境变量PGPORT也可能需要设置.最后一招:如果当你试着启动一个应用而该应用报告说不能与数据库建立联接时,你应该马上与你的数据库管理员联系,如果你就是管理员,那么你就要参考文档以确保你的环境变量得到正确的设置. 

2、体系基本概念
在我们开始讲解之前,我们应该先了解PostgreSQL系统的基本体系.理解PostgreSQL的部件之间的相互关系 将本节显得更清晰一些.

在数据库术语里,PostgreSQL使用一种客户端/服务器的模式.一次 PostgreSQL会话由下列相关的进程(程序)组成∶
一个服务器进程,它管理数据库文件,接受来自客户端应用与数据库的联接,并且代表客户端在数据库上执行操作.数据库服务器程序叫做postmaster. 
那些需要执行数据库操作的用户的客户端(前端)应用.客户端应用可能本身就是多种多样的∶它们可以是一个字符界面的工具,也可以是一个图形界面的应用,或者是一个通过访问数据库来显示网页的web服务器,或者是一个特殊的数据库管理工具.一些客户端应用是和PostgreSQL发布一起提供的,但绝大部分是用户开发的. 
和典型的客户端/服务器应用(C/S应用)一样,这些客户端和服务器可以在不同的主机上.这时它们通过TCP/IP网络联接通讯.你应该记住的是,在客户机上可以访问的文件未必能够在数据库服务器 机器上访问(或者只能用不同的文件名进行访问). 
PostgreSQL服务器可以处理来自客户端的多个并发请求.因此,它为每个请求启动("fork") 一个新的进程.从这个时候开始,客户端和新服务器进程就不再经过 最初的postmaster进程的干涉进行通讯.因此,postmaster 总是在运行,等待着联接, 二客户端和相关联的服务器进程则是起起停停.(当然,用户是肯定看不到这些事情的.我们在这儿谈这些主要是为了完整.) 
3、使用数据库

如果你感兴趣的话,参考中文的用户手册吧,说起来真是太长了。你有使用数据库的经验的话,可以很快的进入PostgreSQL世界的。可以到这里下载使用手册。

如果你还不动心的话,那就看看下面的PostgreSQL的用户的情况。
4、PostgreSQL的用户的情况

Affymetrix:(www.affymetrix.com) 
一个生物技术研究公司,为基因研究工业提供艺术级的研究工具, 
在他们的 Transcriptome 项目中用PostgreSQL存储那些从高密度 
GeneChip? 序列中生成的海量 RNA 表达实验。 
Afilias:(www.nic.info) 
一个域名注册提供商,目前管理互联网上新发布的第一个扩展 .INFO。 
它是一个位于爱尔兰的公司,管理着超过900,000个域名以及超过一千万 
条记录,这些数据都是存放在以PostgreSQL为后端的数据库中。 
BASF:(www.basf.com) 
这个应该熟悉啦,巴斯福,世界上最大的化工公司,使用 PostgreSQL 为他们 
的美国农业综合业的电子商务网站存储数据。 
Cognitivity:(http://www.cognitivity.com/) 
在线学习提供商,它们使用PostgreSQL用于他们的表现软件和管理软件。 
Journyx:(http://www.journyx.com) 

世界公认的基于web的时间和开销跟踪的服务商,拥有超过一百万最终用户。 
他们将PostgreSQL用于他们所有unix平台上的内部数据库操作 
(Linux, BSD, AIX, Solaris, 以及很快还有 MacOS X)。
Royal: 
现代Royal打字机公司,他们的在线电子商务网站什么东西都用 
PostgreSQL存储。 
The American Chemical Society: 
美国化学社区,(www.acs.org),世界上最大的专业化学组织, 
拥有超过165,000个成员,以及一个每天有超过一千二百万人访问 
的网站。他们的刊物档案馆存储了125年的所有出版物(两千五百万 
页,超过1T的数据),用的是PostgreSQL。(目前已知PostgreSQL 
最大的数据库)。 
Tsutaya: 
日本最大的视频节目租赁连锁店,用PostgreSQL存储他们超过几个G, 
几百万条记录的数据,以及做他们的商业信息数据库。 
哦,对了,还有Cisco,大家到: 
http://www.cisco.com/public/pubsearch.html 
搜索一下 PostgreSQL 就知道了。

参考资料:

PostgreSQL中文网站 http://laser.zhengmai.com.cn/

中国Linux论坛 http://www.linuxforum.net/

中国Unix论坛 http://www.chinaunix.net

使用C/C++开发PostgreSQL http://www-900.ibm.com/developerWorks/cn/linux/l-pgsql/index.shtml

时间: 2024-08-08 05:50:43

PostgreSQL实实在在的选择的相关文章

MySQL与PostgreSQL:该选择哪个开源数据库?哪一个更好?

Naresh Kumar是一位软件工程师与热情的博主,对编程与新事物充满了激情和兴趣.近日,Naresh撰写了一篇博文,对开源世界最常见的两种数据库MySQL与PostgreSQL的特点进行了详尽的分析和比对. 如果打算为项目选择一款免费.开源的数据库,那么你可能会在MySQL与PostgreSQL之间犹豫不定.MySQL与PostgreSQL都是免费.开源.强大.且功能丰富的数据库.你主要的问题可能是:哪一个才是最好的开源数据库,MySQL还是PostgreSQL呢?该选择哪一个开源数据库呢?

评价:MySQL和PostgreSQL的优劣较量

这篇文章中,我们选用MySQL 4.0.2-alpha与PostgreSQL 7.2进行比较,因为MySQL 4.0.2-alpha开始支持事务的概念,因此这样的比较对于MySQL应该较为有利. 我们这样的比较不想仅仅成为一份性能测试报告,因为至少从我个人来看,对于一个数据库,稳定性和速度并不能代表一切.对于一个成熟的数据库,稳定性肯定会日益提供.而随着硬件性能的飞速提高,速度也不再是什么太大的问题. 一.两者的共同优势 这两个产品都属于开放源码的一员,性能和功能都在高速地提高和增强.MySQL

MySQL与PostgreSQL比较哪个数据库更好?

  如果打算为项目选择一款免费.开源的数据库,那么你可能会在MySQL与PostgreSQL之间犹豫不定.MySQL与PostgreSQL都是免费.开源.强大.且功能丰富的数据库.你主要的问题可能是:哪一个才是最好的开源数据库,MySQL还是PostgreSQL呢?该选择哪一个开源数据库呢? 在选择数据库时,你所做的是个长期的决策,因为后面如果再改变决定将是非常困难且代价高昂的.你希望一开始就选择正确.两个流行的开源数据库MySQL与PostgreSQL常常成为最后要选择的产品.对这两个开源数据

PostgreSQL SQL HINT的使用

PostgreSQL优化器是基于成本的 (CBO) , (当然, 如果开启了GEQO的话, 在关联表数量超过一定阈值后, 会采用GEQO, 这主要是因为在关联表太多的情况下, 穷举法可能带来巨大的PLAN开销, 所以GEQO输出的执行计划不一定是最优的) 本文要谈的和GEQO没什么关系, 主要和CBO相关. 当PostgreSQL使用CBO时, 就一定能每次都输出最优的执行计划吗? 1. 首选我们看看CBO考察了哪些因素, 它是如何计算成本的? 成本和扫描方式, 关联方式, 操作符, 成本因子,

全文检索 (不包含、不等于) 索引优化 - 阿里云RDS PostgreSQL最佳实践

背景 PostgreSQL内置了GIN索引,支持全文检索,支持数组检索等多值数据类型的检索. 在全文检索中,不包含某个关键字能用到索引吗? 实际上GIN是倒排索引,不包含某个关键字的查询,实际上是跳过主tree上面的TOKEN的扫描. 只要被跳过的TOKEN包含了大量数据,那么就是划算的.PostgreSQL是基于CBO的执行计划优化器,所以会自动选择最优的索引. 例子1,全文检索不包含查询 1.创建测试表 postgres=# create table notcontain (id int,

一文掌握云数据库现状与前沿技术

「一切都会运行在云端」.现在越来越多的业务从自己维护基础设施转移到公有(或者私有)云上, 带来的好处也是无需赘述的,极大降低了 IaaS 层的运维成本,对于数据库层面来说的,以往需要很强的 DBA 背景才能搞定弹性扩容高可用什么的高级动作,现在大多数云服务基本都或多或少提供了类似的服务. 今天的分享主要集中在比较顶尖的云服务商的云数据库方案背后的架构,以及我最近观察到的一些对于云数据库有意义的工业界的相关技术的进展. Amazon RDS 其实说到公有云上的云数据库,应该最早 Amazon 的

全千兆网吧路由器VR4920报价只要3499

(山东IT网 济南行情)飞鱼星科技再次推出了一款全千兆网吧路由器VR4920,该产品济南维高网络的报价为3499元,是一款极具性价比的全千兆网吧路由器,并与同类型产品价格进行对比后,该价格是最便宜的一款全千兆级别的网吧路由器,值得推荐给一些急需建立千兆网络环境的网吧. 据悉,VR4920是飞鱼星4000系列中的一款最新设备,相比以往的4000系列产品,设备的CPU.内存大幅度提升,并将百兆接口提升为千兆端口.CPU采用的是64位全千兆网络处理器,产品的性能十分优越,封包处理快速且稳定,数据吞吐能

空间|时间|对象 圈人 + 目标人群透视 - 暨PostgreSQL 10与Greenplum的对比和选择

标签 PostgreSQL , PostGIS , geohash , brin , gist索引 , Greenplum , HybridDB for PostgreSQL 背景 通常一个人的常驻地可能会包括:家.儿女家.双方父母家.情人.异性伴侣家.公司.商圈若干等. 通过对这些数据的运营,可以实现很多业务需求.例如: 1.寻人 <海量用户实时定位和圈人 - 团圆社会公益系统(位置寻人\圈人)> 2.线下广告投放人群圈选,选址,商圈人群画像. <数据寻龙点穴(空间聚集分析) - 阿里

PostgreSQL vs Greenplum Hash outer join (hash表的选择)

标签 PostgreSQL , Greenplum , hash outer join , hash table 背景 数据分析.大表JOIN.多表JOIN时,哈希JOIN是比较好的提速手段. hash join会首先扫描其中的一张表(包括需要输出的字段),根据JOIN列生成哈希表.然后扫描另一张表. hash join介绍 https://www.postgresql.org/docs/10/static/planner-optimizer.html the right relation is