PostgreSQL 概述
- 52.1.1. 消息概貌
- 52.1.2. 扩展查询概述
- 52.1.3. 格式和格式代码
协议在启动和正常操作过程中有不同的阶段。在启动阶段里,前端打开一个到服务器的连接并且认证自身以满足服务器(这可能涉及到一条或多条消息,取决于使用的认证方法)。 如果一切正常,服务器就发送状态信息给前端,并最后进入正常操作。除了最初的启动请求消息之外,协议的这个部分是服务器驱动的。
在正常操作中,前端发送查询和其它命令到后端,然后后端返回查询结果和其它响应。在少数几种情况(比如NOTIFY
)中,后端会发送未被请求的消息,但这个会话中的绝大多部分都是由前端请求驱动的。
会话的终止通常是由前端来选择的,但是也可以在某些情况下由后端强制执行。不管在那种情况下,如果后端关闭连接,那么它将在退出之前回滚所有打开的(未完成的)事务。
在正常操作中,SQL命令可以通过两个子协议中的任何一个执行。 在“简单查询”协议中,前端只是发送一个文本查询串, 然后后端马上分析并执行它。在“扩展查询”协议中, 查询的处理被分割为多个步骤:分析、参数值绑定和执行。这样就可以提供灵活性和性能的改进,但代价是额外的复杂性。
正常操作还有用于类似COPY
这样的额外的子协议。
52.1.1. 消息概貌
所有通讯都是通过一个消息流进行的。消息的第一个字节标识消息类型, 然后后面跟着的四个字节声明消息剩下部分的长度(这个长度包括长度域自身,但是不包括消息类型字节)。 剩下的消息内容由消息类型决定。由于历史原因,客户端发送的最初的消息(启动消息)不包含消息类型字节。
为了避免失去与消息流的同步,服务器和客户端通常都是把整个消息读取到一个缓冲区里(使用字节计数), 然后才试图处理其内容。这样在处理内容的过程时如果发现错误,就比较容易恢复。 在非常极端的情况下(比如说没有足够的内存缓冲消息),接收端可以使用字节计数来判断它在继续读取消息之前需要跳过多少输入。
反之,服务器和客户端都需要注意决不能发送一条不完整的消息。保证这一点的方法通常是在发送整条信息之前先在一个缓冲区里整理整条消息。 如果在发送或者接受一条消息的中间发生了通讯错误,那么唯一合理的响应是放弃连接,因为恢复消息边界同步的希望很小。
52.1.2. 扩展查询概述
在扩展查询协议中,SQL命令的执行是分割成多个步骤的。步骤与步骤之间保存的状态是由两类的对象代表的:预备语句(prepared statements)和入口(portals)。 一个预备语句代表一个文本查询字符串的经过分析、语意解析以及规划之后的结果。一个预备语句不代表它已经可以被执行,因为它可能还缺乏 参数的值。 一个入口代表一个已经可以执行的或者已经被部分执行过的语句,所有缺失的参数值都已经填充到位了(对于
SELECT
语句,入口等效于一个打开的游标, 但我们使用不同的术语是因为游标不能处理非SELECT
语句)。
完整的执行周期包括一个分析步骤, 它从一个文本的查询字符串里创建一个预备语句; 一个绑定步骤, 它用一个预备语句和任何所需的参数值创建一个入口;以及一个执行步骤,它运行一个入口中的查询。如果查询会返回数据行(SELECT
、SHOW
等),
执行步骤会被告知只抓取有限的一些行,这样就可能需要多个执行步骤来完成操作。
后端可以跟踪多个预备语句和入口(但是要注意,这些只存在于一个会话内部,不能在会话之间共享)。现有的预备语句和入口都是用创建它们的时候赋予的名字引用的。 另外,还存在一个“未命名”的预备语句和入口。 尽管它们的行为和命名对象大部分相同,但是它们是针对只执行一次然后就抛弃的查询而优化的, 而在命名对象上的操作是针对多次使用而优化的。
52.1.3. 格式和格式代码
特定数据类型的数据可以用几种不同的格式中的任意一种来传递。 从PostgreSQL 7.4开始,只支持“文本”和“二进制”两种格式, 但是协议为未来的扩展提供了的手段。任意值要求的格式用一个 格式代码声明。 客户端可以为每个传输的参数值和查询结果的每个列指定一个格式代码。 文本的格式代码是零,二进制的格式代码是一,所有其它的格式代码都保留给将来定义。
文本形式的数值是特定数据类型的输入/输出转换函数生成或接受的任何字符串。在传输形式上,字符串没有末尾空字符;如果前端要想把收到的值当作C字符串处理,那么必须自己加上一个(顺便说一下,文本格式不允许嵌入空字符)。
整数的二进制形式采用网络字节序(高位在前)。对于其它数据类型,请参考文档或者源代码获取其二进制形式的信息。请注意,复杂数据类型的二进制形式可能在不同服务器版本之间变化; 文本格式通常是最具有移植性的选择。