花下猫语:对于 JSON 数据格式,相信你并不陌生(如果不知道,那正好系统地了解下)。然而,关于它的诞生与发展过程,你是否了解呢?关于它的几种数据格式、使用场景以及注意事项,你是否熟知呢?今天分享一篇长文,一起来学习下吧~
剧照 |《庆余年》上篇(JSON的诞生与发展介绍)我们讲解了JSON的诞生原因是因为XML整合到HTML中各个浏览器实现的细节不尽相同,所以道格拉斯·克罗克福特(Douglas Crockford) 和 奇普·莫宁斯达(Chip Morningstar)一起从JS的数据类型中提取了一个子集,作为新的数据交换格式,因为主流的浏览器使用了通用的JavaScript引擎组件,所以在解析这种新数据格式时就不存在兼容性问题,于是他们将这种数据格式命名为 “JavaScript Object Notation”,缩写为 JSON,由此JSON便诞生了!今天我们来学习一下JSON的结构形式、数据类型、使用场景以及注意事项吧!目录:
一、JSON格式
1.JSON的2种结构形式
2.JOSN的6种数据类型
二、JSON使用场景
1.接口返回数据
2.序列化
3.生成Token
4.配置文件
三、JSON在Python中的使用
1.类型转换
2.对应的数据类型
3.需要注意的点
四、总结
一、JSON格式上面我们知道JSON是从JavaScript的数据类型中提取出来的子集,那JSON有几种结构形式呢?又有哪些数据类型呢?他们又分别对应着JavaScript中的哪些数据类型呢?1.JSON的2种结构形式1、键值对形式上期我们举了一个JSON的实例,就是键值对形式的,如下:{ “person”: { “name”: “pig”, “age”: “18”, “sex”: “man”, “hometown”: { “province”: “江西省”, “city”: “抚州市”, “county”: “崇仁县” } }}这种结构的JSON数据规则是:一个无序的“‘名称/值’对”集合。一个对象以 {左括号 开始, }右括号 结束。每个“名称”后跟一个 :冒号 ;“‘名称/值’ 对”之间使用 ,逗号 分隔。
2、数组形式因为大多数的时候大家用的JSON可能都是上面那种key-value形式,所以很多人在讲解JSON的时候总是会忽略数组形式,这一点是需要注意的。那JSON的数组形式是怎么样的呢?猪哥也举一个实例吧![“pig”, 18, “man”, “江西省抚州市崇仁县”]数组形式的JSON数据就是值(value)的有序集合。一个数组以 [左中括号 开始, ]右中括号 结束。值之间使用 ,逗号 分隔。
2.JOSN的6种数据类型上面两种JSON形式内部都是包含value的,那JSON的value到底有哪些类型,而且上期我们说JSON其实就是从Js数据格式中提取了一个子集,那具体有哪几种数据类型呢?
string:字符串,必须要用双引号引起来。
number:数值,与JavaScript的number一致,整数(不使用小数点或指数计数法)最多为 15 位,小数的最大位数是 17。
object:JavaScript的对象形式,{ key:value }表示方式,可嵌套。
array:数组,JavaScript的Array表示方式[ value ],可嵌套。
true/false:布尔类型,JavaScript的boolean类型。
null:空值,JavaScript的null。
一般的接口返回数据都会封装成JSON格式,比如类似下面这种{ “code”: 1, “msg”: “success”, “data”: { “name”: “pig”, “age”: “18”, “sex”: “man”, “hometown”: { “province”: “江西省”, “city”: “抚州市”, “county”: “崇仁县” } }}2.序列化程序在运行时所有的变量都是保存在内存当中的,如果出现程序重启或者机器宕机的情况,那这些数据就丢失了。一般情况运行时变量并不是那么重要丢了就丢了,但有些内存中的数据是需要保存起来供下次程序或者其他程序使用。保存内存中的数据要么保存在数据库,要么保存直接到文件中,而将内存中的数据变成可保存或可传输的数据的过程叫做序列化,在Python中叫pickling,在其他语言中也被称之为serialization,marshalling,flattening等等,都是一个意思。正常的序列化是将编程语言中的对象直接转成可保存或可传输的,这样会保存对象的类型信息,而JSON序列化则不会保留对象类型!为了让大家更直观的感受区别,猪哥用代码做一个测试,大家一目了然
Python对象直接序列化会保存class信息,下次使用loads加载到内存时直接变成Python对象。JSON对象序列化只保存属性数据,不保留class信息,下次使用loads加载到内存可以直接转成dict对象,当然也可以转为Person对象,但是需要写辅助方法。对于JSON序列化不能保存class信息的特点,那JSON序列化还有什么用?答案是当然有用,对于不同编程语言序列化读取有用,比如:我用Python爬取数据然后转成对象,现在我需要将它序列化磁盘,然后使用Java语言读取这份数据,这个时候由于跨语言数据类型不同,所以就需要用到JSON序列化。存在即合理,两种序列化可根据需求自行选择!3.生成Token首先声明Token的形式多种多样,有JSON、字符串、数字等等,只要能满足需求即可,没有规定用哪种形式。JSON格式的Token最有代表性的莫过于JWT(JSON Web Tokens)。
随着技术的发展,分布式web应用的普及,通过Session管理用户登录状态成本越来越高,因此慢慢发展成为Token的方式做登录身份校验,然后通过Token去取Redis中的缓存的用户信息,随着之后JWT的出现,校验方式更加简单便捷化,无需通过Redis缓存,而是直接根据Token取出保存的用户信息,以及对Token可用性校验,单点登录更为简单。
猪哥也曾经使用JWT做过app的登录系统,大概的流程就是:用户输入用户名密码app请求登录中心验证用户名密码如果验证通过则生成一个Token,其中Token中包含:用户的uid、Token过期时间、过期延期时间等,然后返回给appapp获得Token,保存在cookie中,下次请求其他服务则带上其他服务获取到Token之后调用登录中心接口验证验证通过则响应JWT登录认证有哪些优势:
性能好:服务器不需要保存大量的session
单点登录(登录一个应用,同一个企业的其他应用都可以访问):使用JWT做一个登录中心基本搞定,很容易实现。
兼容性好:支持移动设备,支持跨程序调用,Cookie 是不允许垮域访问的,而 Token 则不存在这个问题。
安全性好:因为有签名,所以JWT可以防止被篡改。
2、JSON转Python类型:json.loads()# 4、JSON转Python的dict类型person_json = ‘{ “name”: “pig”,”age”: 18, “sex”: “man”, “hometown”: “江西抚州”}’person_json_dict = json.loads(person_json)print(type(person_json_dict), ‘\n’)# 5、JSON转Python的列表类型person_json2 = ‘[“pig”, 18, “man”, “江西抚州”]’person_json_list = json.loads(person_json2)print(type(person_json_list), ‘\n’)# 6、JSON转Python的自定义对象类型person_json = ‘{ “name”: “pig”,”age”: 18, “sex”: “man”, “hometown”: “江西抚州”}’# object_hook参数是将dict对象转成自定义对象person_json_obj = json.loads(person_json, object_hook=lambda d: Person(d[‘name’], d[‘age’], d[‘sex’], d[‘hometown’]))print(type(person_json_obj), ‘\n’)执行结果如下:
2.对应的数据类型上面我们演示了Python类型与JSON的相互转换,最开始的时候我们讲过JSON有6种数据类型,那这6种数据类型分别对应Python中的哪些数据类型呢?
3.需要注意的点JSON的键名和字符串都必须使用双引号引起来,而Python中单引号也可以表示为字符串,所以这是个比较容易犯的错误!Python类型与JSON相互转换的时候到底是用load/dump还是用loads\dumps?他们之间有什么区别?什么时候该加s什么时候不该加s?
这个我们可以通过查看源码找到答案:
不加s的方法入参多了一个fp表示filepath,最后多了一个写入文件的操作。
所以我们在记忆的时候可以这样记忆:
加s表示转成字符串(str),不加s表示转成文件。
Python自定义对象与JSON相互转换的时候需要辅助方法来指明属性与键名的对应关系,如果不指定一个方法则会抛出异常!
相信有些看的仔细的同学会好奇上面猪哥使用json.dumps方法将Python类型转JSON的时候,如果出现中文,则会出现:\u6c5f\u897f\u629a\u5dde这种东西,这是为什么呢?原因是:
Python 3中的json在做dumps操作时,会将中文转换成unicode编码,并以16进制方式存储,而并不是UTF-8格式!
四、总结今天我们学习了JSON的2种形式,切记JSON还有[…]这种形式的。学习了JSON的6种数据类型他们分别对于Python中的哪些类型。了解了JSON的一些使用场景以及实际的例子。还学习了在Python中如何使用JSON以及需要注意的事项。结合上期的JSON的诞生与发展介绍,我们JSON相关的知识基本就介绍的差不多,后面会出一些爬虫实际案例来教大家如何解析返回JSON数据。
一个JSON知识点却分两篇长文(近万字)来讲,其重要性不言而喻。因为不管你是做爬虫、还是做数据分析、web、甚至前端、测试、运维,JSON都是你必须要掌握的一个知识点。
优质文章,推荐阅读:
一份可以令 Python 变快的工具清单
Python对象的空间边界:独善其身与开放包容
Python进阶:如何将字符串常量转为变量?
为什么 C 语言仍然占据统治地位?