vlambda博客
学习文章列表

用 Python 操作 JSON 类型数据详解

JSON简介

JSON(JavaScript Object Notation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScript Programming Language, Standard ECMA-262 3rd Edition - December 1999的一个子集。JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C, C++, C#, Java, JavaScript, Perl, Python等)。这些特性使JSON成为理想的数据交换语言。

JSON官方网站

http://www.json.org/

JSON是一种基于文本,独立于语言的轻量级数据交换格式。JSON的基本语法如下:

1、JSON名称/值对。JSON 数据的书写格式是:名称/值对。名称/值对包括字段名称(在双引号中),然后着是一个冒号(:),最后是值。比如{ "name" : "Python" },类似于Python中的字典。

2、JSON值。JSON值可以是数字(整数或浮点数),字符串(在双引号中),逻辑值(True 或False),数组(在中括号中),对象(在大括号中)和null。例如{ "age": 21,"graduated ":true }。JSON值的基本格式如下图所示。

图 JSON值的基本格式

3、JSON对象。JSON 对象在花括号({})中书写,对象可以包含多个名称/值对,多个JSON名称/值以”,”进行分隔。例如{ "name":"Pyton" , "age": 25}。JSON对象的基本格式如下图所示。

用 Python 操作 JSON 类型数据详解

图 JSON对象

4、JSON 数组。JSON 数组在方括号中书写,数组可包含多个JSON对象。例如:

{
    "sites": [
        { "name""jd",  "url""www.jd.com"   },
        { "name""taobao",   "url""www.taobao.com" }
    ]
}

在本例中对象”sites”是包含2个对象的数组。JSON数组的的基本格式如下图所示。

用 Python 操作 JSON 类型数据详解

Python操作JSON

Pythone3标准库有JSON模块,主要执行序列化和反序列化功能。

  • 序列化(encoding) : 把一个Python对象编码转化为JSON字符串。

  • 反序列化(decoding):把JSON格式字符串解码转换为Python数据对象。

1、json模块的主要函数

在Python3的json模块中json.dumps()函数将Python对象编码成JSON字符串。使用的语法如下:

import json
dumps(obj, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw)

主要参数说明:

  • sort_keys表示序列化JSON对象时是否对字典的key进行排序,字典默认是无序的。

  • indent表示缩进,可以是数据格式可读性更强,格式化输出JSON字符串,如果ident是一个非负的整数,那么JSONarray元素和object成员将会被以相应的缩进级别进行打印输出。

  • separators当使用ident参数时json模块序列化Python对象后得到的JSON字符串中的”,”号和”:”号分隔符后默认会附加一个空白字符,可以通过separators参数重新指定分隔符,去除无用的空白字符。指定的分隔符一般是一个元祖类型的数据,比如(',',':')。

使用json模块的json.load()函数,将JSON格式的字符串转换成Python对象,使用的语法格式如下:

import json
json.load(fp, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw)

2、JSON字符串与Python 原始类型之间数据类型对应关系

Python 原始类型向JSON类型的转化对照表,如表所示:

用 Python 操作 JSON 类型数据详解

表 Python原始类型向JSON类型的转化对照表

JSON类型向Python 原始类型的转化对照表,如表所示:

用 Python 操作 JSON 类型数据详解

表 JSON类型向Python原始类型的转化对照表

3、序列化操作实例

import json

data ={'name':"wangwu" , 'lang': ('python' ,'java'), 'age':20 }
data_json = json.dumps( data )

print( data)
# 输出结果为[{'name''wangwu''lang': ('python''java'), 'age'20}]

print( data_json )
# 输出结果为 [{"name""wangwu""lang": ["python""java"], "age"20}]

从返回结果可以看出data_json字符串中lang数据类型从元祖变成了列表。
还可以对打印的json字符进行美化,可以使用如下Python语句。

data_json = json.dumps(data,sort_keys = True, indent=2 )
print( data_json )

输出结果为

{
  "age"20,
  "lang": [
    "python",
    "java"
  ],
  "name""wangwu"
}

如果要对输出json字符串去除无用的空白字符,可以使用如下Python语句。

data_json = json.dumps(data,sort_keys = True,separators=(',',':') )
print( data_json )

输出结果为:

{"age":20,"lang":["python","java"],"name":"wangwu"}

4、反序列化操作实例,把JSON格式字符串转换为Python对象

new_data = json.loads(data_json )
print(new_data )
print(type(new_data))

输出结果为:

{'age'20'lang': ['python''java'], 'name''wangwu'}
<class 'dict'>

从返回结果可以看出,解码后并没有将原始数据data_json的lang数据还原成元祖,而是还原成了列表。

自定义对象的序列化

如果是类对象,是不是可以可以直接用json.dumps(obj)序列化对象呢?答案是不可以的,需要在类对象里编写转换函数。

例子:自定义对象的序列化

import json  

class Man(object):
    def __init__(self, name, age ):
        self.name = name
        self.age = age

#序列化函数
def obj2json(obj):
    return {
            "name" : obj.name,
            "age" : obj.age
            }

man = Man('tom' , 21)
jsonDataStr = json.dumps( man , default=obj2json)
print( jsonDataStr )

运行脚本得到以下输出结果:

{"name""tom""age"21}

json.dumps()函数中的可选参数default就是把任意一个对象变成一个可序列为JSON的对象,我们只需要为Man专门写一个转换函数,再把函数传进去即可。

通过一种简单的方式,用lambda方式来转换任意一个类对象为JSON形式。

jsonDataStr = json.dumps(man, default=lambda obj: obj.__dict__)

lambda obj: obj.__dict__会将任意的对象的属性,转换成字典的方式。同样的道理,如果要将JSON对象反序列化,也需要写个反序列化函数来转换。

json.loads(json_str, object_hook=handle)
import json  

class Man(object):
    def __init__(self, name, age ):
        self.name = name
        self.age = age

def obj2json(obj):
    return {
            "name" : obj.name,
            "age" : obj.age
            }

# 反序列化处理函数
def handle( obj ):
    print( type(obj))
    return Man(obj['name'] , obj['age'])

man = Man('tom' , 21)
jsonDataStr = json.dumps( man , default=obj2json)

jsonObj = json.loads(jsonDataStr, object_hook=handle  )

在本例中编写反序列化函数handle()把JSON字符串转换成Python类的对象。

留言回复你用Python做过哪些有趣的应用项目,我们会在留言中随机抽取一位读者免费送出北京大学出版社出版的《Python 3 数据分析与机器学习实战》图书一本。

热 门 推 荐











文章节选自北京大学出版社出版的《Python 3 数据分析与机器学习实战》,本书现在京东参加满100减50的活动,点击阅读原文购书有优惠~