阅读(1290) 赞(0)

在 Python3 中使用 JSON

2021-08-26 10:09:57 更新

本教程将会教我们如何使用 Python 编程语言编码和解码 JSON。

环境

在python3中（以及python2.6版本后的python2版本）内置了JSON模块，无需额外安装另外的JSON模块。

简介

JSON模块是python内置的用来进行python对象序列化和反序列化的模块。

序列化，指将python对象转换为json格式的数据流，反序列化则是将json格式的数据流转换为python对象。

该模块中常用的方法有以下四个：

json.dump 将Python对象序列化为Json格式的数据流并写入文件类型的对象中

json.dumps 将Python对象序列化为Json格式的字符串

json.load 从文件类型的对象中读取Json格式的数据并反序列化成Python对象

json.loads 将包含Json格式数据的字符串反序列化成Python对象

两个dump函数是将python对象转换为json，可以理解为编码（类似demjson的encode函数），两个load函数是将json转换为python对象，可以理解为JSON解析（类似demjson的code函数）。因为两个dump和两个load的功能相似，所以小编只介绍其中一个（介绍JSON格式数据的字符串的编码与解析，也就是dumps和loads函数）。

json.dumps()

dumps可以传递的参数如下：

json.dumps(obj,  skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False)

在日常使用中，更多的情况我们只传递必须的obj参数（这是一个对象），其他参数为可选参数，下表是该函数的所有参数的作用：

参数	作用
`obj`（必选项）	要序列化的python对象
`skipkeys=False`	是否跳过要序列化的对象中字典元素的key不是基本类型的数据；如果为 `True`，则跳过，如果为 `False`，将抛出 `TypeError`异常。
`ensure_ascii=True`	是否将要序列化的对象中的字符串中的非ascii字符进行转义。如果该参数为`True`，则将字符串中的非ascii字符转义成unicode字符串，否则，将不会进行转义。
`check_circular=True`	是否进行容器类型的循环引用检查。如果该参数设置为`False`，则不进行检查，但是可能会引发 `OverflowError`或更严重的情况。如果该参数设置为`True`，则将进行容器类型的循环引用检查，并在发现循环引用时抛出异常。
`allow_nan=True`	是否允许序列化超出范围的`float` 类型的值（如`float('inf')` 、`float('-inf')` 、`float('nan')` ）。如果该参数设置为`True`，则上面列出的那些值将依次使用JavaScript中等价的值（ `Infinity`、`-Infinity`、 `NaN`）来进行替代；如果该参数设置为`False`，并且要序列化的对象中出现了那些超出范围的值，则将引发`ValueError`异常。
`indent=None`	是否在数组元素和对象成员前增加缩进以便使格式更加美观。如果该参数设置为大于等于1的整数，则添加换行符和对应数量的空格表示缩进，如果设置为`0`，则表示只添加换行符，如果设置为 `None`，则表示无缩进。
`separators=None`	设置Json中各项之间、对象的键和值之间的分隔符；该参数必须是一个2元组，元组第一个元素表示Json数据中各项之间的分隔符，元组的第二个元素表示Json对象的键和值之间的分隔符。默认的分隔符为（’,’, ‘:’）
`default=None`	指定一个函数，用来将不可进行序列化的Python对象转化为可序列化的Python对象。
`cls=None`	指定一个定制的`JSONEncoder` 的子类（例如，重写了`.default()` 方法用来序列化附加的类型），指定该参数时请使用`cls` 关键字参数。如果未指定该参数，则将使用默认的`JSONEncoder` 。
`sort_keys=False`	是否要将对象中字典元素按照key进行排序。默认为`False`，即不进行排序，若指定为 `True`，则会进行排序。

举个简单的例子：

#!/usr/bin/python3
import json
# Python 字典类型转换为 JSON 对象
data = {
    'no' : 1,
    'name' : 'W3CSchool',
    'url' : 'http://www.zijiebao.com'
}
json_str = json.dumps(data)
print ("Python 原始数据：", repr(data))
print ("JSON 对象：", json_str)

python对象转化为JSON字符串的时候遵循以下转换规则：

Python	Json
dict	object
list, tuple	array
str	string
int, float	number
True	true
False	false
None	null

json.loads()

loads可以传递的参数如下：

json.loads(s,encoding=None, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None)

在日常使用中，更多的情况我们只传递必须的s参数（这是一个字符串），其他参数为可选参数，下表是该函数的所有参数的作用：

参数	作用
`s`（必选项）	要反序列化的JSON字符串
encoding=None	该参数已弃用，将会被忽略
cls=None	指定一个定制的`JsonDecoder` 子类，以便实现特定的反序列化需求；
object_hook=None	接受一个可调用对象，用于处理解码后生成的Python对象中`dict`类型的值。注意，这个处理过程是递归进行的，即返回的Python对象内部所有的字典结构都将被这个方法处理
`parse_float=None`	用于处理解码后的Python对象中的`float`类型的值。
`parse_int=None`	接受一个可调用对象，用于处理解码后的Python对象中的`int` 类型的值。
`parse_constant=None`	接受一个可调用对象，用于解码时对 `Infinity`、 `-Infinity`、 `NaN`或其他非法的Json数值的处理。
`object_parse_hook=None`	如果指定了该参数并且设置为一个可调用对象，那么Json对象将被解码成一个元素为二元组的列表，二元组的两个元素分别为Json对象中的键值对的键和值，并且列表中元素的顺序与Json对象中键值对的顺序一致。

举个简单的例子：

#!/usr/bin/python3
import json
# Python 字典类型转换为 JSON 对象
data1 = {
    'no' : 1,
    'name' : 'W3CSchool',
    'url' : 'http://www.zijiebao.com'
}

json_str = json.dumps(data1)
print ("Python 原始数据：", repr(data1))
print ("JSON 对象：", json_str)

# 将 JSON 对象转换为 Python 字典
data2 = json.loads(json_str)
print ("data2['name']: ", data2['name'])
print ("data2['url']: ", data2['url'])

与序列化的过程类似，JSON转化为python对象也遵循一定的规则：

Json	Python
object	dict
array	list
string	str
number（int）	int
number（real）	float
true	True
false	False
null	None

← 在 Python2 中使用 JSON

在 Ruby 中使用 JSON →

在 Python3 中使用 JSON

环境

简介

json.dumps()

json.loads()

推荐文章

推荐教程

最新教程