程序員都應該了解的一種數據格式之 JSON

者 | 豬哥

責編 | maozz

JSON的誕生原因是因為XML整合到HTML中各個瀏覽器實現的細節不盡相同，所以道格拉斯·克羅克福特（Douglas Crockford）和奇普·莫寧斯達（Chip Morningstar）一起從JS的數據類型中提取了一個子集，作為新的數據交換格式，因為主流的瀏覽器使用了通用的JavaScript引擎組件，所以在解析這種新數據格式時就不存在兼容性問題，于是他們將這種數據格式命名為 “JavaScript Object Notation”，縮寫為 JSON，由此JSON便誕生了！

今天我們來學習一下JSON的結構形式、數據類型、使用場景以及注意事項吧！

JSON格式

上面我們知道JSON是從JavaScript的數據類型中提取出來的子集，那JSON有幾種結構形式呢？又有哪些數據類型呢？他們又分別對應著JavaScript中的哪些數據類型呢？

JSON的2種結構形式，鍵值對形式和數組形式。

舉了一個JSON的實例，就是鍵值對形式的，如下：

{
"person": {
"name": "pig",
"age": "18",
"sex": "man",
"hometown": {
"province": "江西省",
"city": "撫州市",
"county": "崇仁縣"
}
}
}

這種結構的JSON數據規則是：一個無序的“‘名稱/值’對”集合。一個對象以 {左括號開始， }右括號結束。每個“名稱”后跟一個 :冒號；“‘名稱/值’ 對”之間使用 ,逗號分隔。

因為大多數的時候大家用的JSON可能都是上面那種key-value形式，所以很多人在講解JSON的時候總是會忽略數組形式，這一點是需要注意的。

那JSON的數組形式是怎么樣的呢？舉一個實例吧！

["pig", 18, "man", "江西省撫州市崇仁縣"]

數組形式的JSON數據就是值（value）的有序集合。一個數組以 [左中括號開始， ]右中括號結束。值之間使用 ,逗號分隔。

JOSN的6種數據類型

上面兩種JSON形式內部都是包含value的，那JSON的value到底有哪些類型，而且上期我們說JSON其實就是從Js數據格式中提取了一個子集，那具體有哪幾種數據類型呢？

string：字符串，必須要用雙引號引起來。
number：數值，與JavaScript的number一致，整數（不使用小數點或指數計數法）最多為 15 位，小數的最大位數是 17。
object：JavaScript的對象形式，{ key:value }表示方式，可嵌套。
array：數組，JavaScript的Array表示方式[ value ]，可嵌套。
true/false：布爾類型，JavaScript的boolean類型。
：空值，JavaScript的。

以上數據形式圖片來源JSON官方文檔：http://www.json.org/json-zh.html

JSON使用場景

介紹完JSON的數據格式，那我們來看看JSON在企業中使用的比較多的場景。

接口返回數據和序列化。JSON用的最多的地方莫過于Web了，現在的數據接口基本上都是返回的JSON，具體細化的場景有：

Ajxa異步訪問數據
RPC遠程調用
前后端分離后端返回的數據
開放API，如百度、高德等一些開放接口
企業間合作接口

這種API接口一般都會提供一個接口文檔，說明接口的入參、出參等，

一般的接口返回數據都會封裝成JSON格式，比如類似下面這種

{
"code": 1,
"msg": "success",
"data": {
"name": "pig",
"age": "18",
"sex": "man",
"hometown": {
"province": "江西省",
"city": "撫州市",
"county": "崇仁縣"
}
}
}

程序在運行時所有的變量都是保存在內存當中的，如果出現程序重啟或者機器宕機的情況，那這些數據就丟失了。一般情況運行時變量并不是那么重要丟了就丟了，但有些內存中的數據是需要保存起來供下次程序或者其他程序使用。

保存內存中的數據要么保存在數據庫，要么保存直接到文件中，而將內存中的數據變成可保存或可傳輸的數據的過程叫做序列化，在Python中叫pickling，在其他語言中也被稱之為serialization，marshalling，flattening等等，都是一個意思。

正常的序列化是將編程語言中的對象直接轉成可保存或可傳輸的，這樣會保存對象的類型信息，而JSON序列化則不會保留對象類型！

為了讓大家更直觀的感受區別，豬哥用代碼做一個測試，大家一目了然

Python對象直接序列化會保存class信息，下次使用loads加載到內存時直接變成Python對象。
JSON對象序列化只保存屬性數據，不保留class信息，下次使用loads加載到內存可以直接轉成dict對象，當然也可以轉為Person對象，但是需要寫輔助方法。

對于JSON序列化不能保存class信息的特點，那JSON序列化還有什么用？答案是當然有用，對于不同編程語言序列化讀取有用，比如：我用Python爬取數據然后轉成對象，現在我需要將它序列化磁盤，然后使用Java語言讀取這份數據，這個時候由于跨語言數據類型不同，所以就需要用到JSON序列化。

存在即合理，兩種序列化可根據需求自行選擇！

最后就是生成Token和配置文件

首先聲明Token的形式多種多樣，有JSON、字符串、數字等等，只要能滿足需求即可，沒有規定用哪種形式。

JSON格式的Token最有代表性的莫過于JWT（JSON Web Tokens）。

隨著技術的發展，分布式web應用的普及，通過Session管理用戶登錄狀態成本越來越高，因此慢慢發展成為Token的方式做登錄身份校驗，然后通過Token去取Redis中的緩存的用戶信息，隨著之后JWT的出現，校驗方式更加簡單便捷化，無需通過Redis緩存，而是直接根據Token取出保存的用戶信息，以及對Token可用性校驗，單點登錄更為簡單。

使用JWT做過app的登錄系統，大概的流程就是：

用戶輸入用戶名密碼
app請求登錄中心驗證用戶名密碼
如果驗證通過則生成一個Token，其中Token中包含：
用戶的uid、Token過期時間、過期延期時間等，然后返回給app
app獲得Token，保存在cookie中，下次請求其他服務則帶上
其他服務獲取到Token之后調用登錄中心接口驗證
驗證通過則響應

JWT登錄認證有哪些優勢：

性能好：服務器不需要保存大量的session
單點登錄（登錄一個應用，同一個企業的其他應用都可以訪問）：使用JWT做一個登錄中心基本搞定，很容易實現。
兼容性好：支持移動設備，支持跨程序調用，Cookie 是不允許垮域訪問的，而 Token 則不存在這個問題。
安全性好：因為有簽名，所以JWT可以防止被篡改。更多JWT相關知識自行在網上學習，本文不過多介紹！

說實話JSON作為配置文件使用場景并不多，最具代表性的就是npm的package.json包管理配置文件了，下面就是一個npm的package.json配置文件內容。

{
"name": "server", //項目名稱
"version": "0.0.0",
"private": true,
"main": "server.js", //項目入口地址，即執行npm后會執行的項目
"scripts": {
"start": "node ./bin/www" ///scripts指定了運行腳本命令的npm命令行縮寫
},
"dependencies": {
"cookie-parser": "~1.4.3", //指定項目開發所需的模塊
"debug": "~2.6.9",
"express": "~4.16.0",
"http-errors": "~1.6.2",
"jade": "~1.11.0",
"morgan": "~1.9.0"
}
}

但其實JSON并不合適做配置文件，因為它不能寫注釋、作為配置文件的可讀性差等原因。

配置文件的格式有很多種如：toml、yaml、xml、ini等，目前很多地方開始使用yaml作為配置文件格式。

JSON在Python中的使用

最后我們來看看Python中操作JSON的常用方法有哪些，在Python中操作JSON時需要引入json標準庫。

import json

類型轉換

Python類型轉JSON：json.dump

# 1、Python的dict類型轉JSON
person_dict = {'name': 'pig', 'age': 18, 'sex': 'man', 'hometown': '江西撫州'}
# indent參數為縮進空格數
person_dict_json = json.dumps(person_dict, indent=4)
print(person_dict_json, '\n')
# 2、Python的列表類型轉JSON
person_list = ['pig', 18, 'man', '江西撫州']
person_list_json = json.dumps(person_list)
print(person_list_json, '\n')
# 3、Python的對象類型轉JSON
person_obj = Person('pig', 18, 'man', '江西撫州')
# 中間的匿名函數是獲得對象所有屬性的字典形式
person_obj_json = json.dumps(person_obj, default=lambda obj: obj.__dict__, indent=4)
print(person_obj_json, '\n')

執行結果：

JSON轉Python類型：json.loads

# 4、JSON轉Python的dict類型
person_json = '{ "name": "pig","age": 18, "sex": "man", "hometown": "江西撫州"}'
person_json_dict = json.loads(person_json)
print(type(person_json_dict), '\n')
# 5、JSON轉Python的列表類型
person_json2 = '["pig", 18, "man", "江西撫州"]'
person_json_list = json.loads(person_json2)
print(type(person_json_list), '\n')
# 6、JSON轉Python的自定義對象類型
person_json = '{ "name": "pig","age": 18, "sex": "man", "hometown": "江西撫州"}'
# object_hook參數是將dict對象轉成自定義對象
person_json_obj = json.loads(person_json, object_hook=lambda d: Person(d['name'], d['age'], d['sex'], d['hometown']))
print(type(person_json_obj), '\n')

執行結果如下：

對應的數據類型

上面我們演示了Python類型與JSON的相互轉換，最開始的時候我們講過JSON有6種數據類型，那這6種數據類型分別對應Python中的哪些數據類型呢？

需要注意的點

JSON的鍵名和字符串都必須使用雙引號引起來，而Python中單引號也可以表示為字符串，所以這是個比較容易犯的錯誤！

Python類型與JSON相互轉換的時候到底是用load/dump還是用loads\dumps？

他們之間有什么區別？
什么時候該加s什么時候不該加s？

這個我們可以通過查看源碼找到答案：

不加s的方法入參多了一個fp表示filepath，最后多了一個寫入文件的操作。

所以我們在記憶的時候可以這樣記憶：

加s表示轉成字符串(str)，不加s表示轉成文件。

Python自定義對象與JSON相互轉換的時候需要輔助方法來指明屬性與鍵名的對應關系，如果不指定一個方法則會拋出異常！

相信有些看的仔細的同學會好奇上面使用json.dumps方法將Python類型轉JSON的時候，如果出現中文，則會出現：

\u6c5f\u897f\u629a\u5dde

這種東西，這是為什么呢？

原因是：Python 3中的json在做dumps操作時，會將中文轉換成unicode編碼，并以16進制方式存儲，而并不是UTF-8格式！

總結

今天我們學習了JSON的2種形式，切記JSON還有[...]這種形式的。

學習了JSON的6種數據類型他們分別對于Python中的哪些類型。

了解了JSON的一些使用場景以及實際的例子。

還學習了在Python中如何使用JSON以及需要注意的事項。

一個JSON知識點卻分兩篇長文（近萬字）來講，其重要性不言而喻。因為不管你是做爬蟲、還是做數據分析、web、甚至前端、測試、運維，JSON都是你必須要掌握的一個知識點

本文為作者投稿，版權歸作者個人所有。

一篇文章我們介紹了一個html/xml解析器——htmlparser，這篇文章我們介紹另外一個解析模塊htmlparser2，后者是對前者的重構，同時對前者的API做了部分兼容。

用法簡介

安裝

const { Parser } = require('htmlparser2');
const parser = new Parser(handler, options);
parser.parseComplete('html/xml內容');

寫法

const { Parser } = require('htmlparser2');
const parser = new Parser(handler, options);
parser.parseComplete('html/xml內容');

htmlparser2提供了一個解析器——Parser，初始化它至少需要一個handler，options是可選的。

handler是一個對象，在這個對象上可以設置很多的鉤子函數，Parser解析時會在每個階段運行對應的鉤子函數。

以下是可以設置的所有的鉤子函數，

onopentag(<str> name, <obj> attributes)

onopentagname(<str> name)

onattribute(<str> name, <str> value)

ontext(<str> text)

onclosetag(<str> name)

onprocessinginstruction(<str> name, <str> data)

oncomment(<str> data)

oncommentend()

oncdatastart()

oncdataend()

onerror(<err> error)

onreset()

onend()

htmlparser模塊是通過正則表達式來解析html內容的，而htmlparser2則不同，它會按順序讀取html的每個字符，并且推測后面字符是標簽名、屬性還是其他的類型，所以htmlparser2在解析完每一個標簽后都會運行相應的鉤子函數。

先來看一下例子，

圖1

圖1中設置了所有的鉤子函數以便來說明每個鉤子函數的作用，運行一下，

圖2

對照圖1和圖2就能看出來每個鉤子函數的運行時機，這其中有以下幾個鉤子函數需要注意一下。

oncdatastart和oncdataend會在解析<![CDATA[文本]]>標簽時觸發，但是觸發的前提是選項設置了recognizeCDATA=true或者xmlMode=true；
onprocessinginstruction會在解析<!xxyy>或者<?xxyy>這樣的標簽時觸發，xx和yy中間可以有分隔符（斜杠或者空格），分隔符前面的字符串就是鉤子函數中的name的值；
運行parseComplete方法會執行reset鉤子函數，如果僅僅執行parser的write或者end方法并不會執行reset方法。

除了自定義handler以外，htmlparser2還提供了幾個handler，比如DomHandler，用法如下：

圖3

運行一下，我們看看結果，

圖4

如果4所示，DomHandler處理的結果是以數組的形式輸出的，在每個單元數據中還可以拿到上一個、下一個以及父節點的數據。

htmlparser2還可以通過操作流Stream解析內容，寫法如下：

圖5

總結

這篇文章和上一篇是姊妹篇，都是介紹解析html/xml內容的模塊，通過對比，我們發現htmlparser2模塊功能更強大一些，也更靈活一些，同時也兼容htmlparser模塊的一些接口。雖然兩者功能類似，但是這給了我們更多的選擇性。

喜歡我的文章就關注我吧，有問題可以發表評論，我們一起學習，共同成長！

or...in語句解析

<script>
var json={a: 12, b: 5};
for(var i in json)
{
alert(i+'='+json[i]);
}
</script>

eval() 函數可計算某個字符串, 并執行其中的的 JavaScript 代碼。

服務器端腳本代碼：

<?php
$row=array('username'=>'lisi','password'=>'222222');
echo json_encode($row);
/*$data=array(
array('name'=>'zhangsan','age'=>18),
array('name'=>'lisi','age'=>30)
);
echo json_encode($data);
*/
?>

var json=eval('('+value+')'); 主要是針對關聯數組

返回："{name:'zhangsan',age:18}"

訪問方式:json.username+json.password

var json=eval(value); 主要是針對索引數組

返回："[{name:'zhangsan',age:18},{name:'lisi',age:20}]"

訪問方式:json[0].name+json[0].age

注意：索引數組的解析也可以采用 var json=eval(value);

<script language="javascript" src="public.js"></script>
<script>
var xhr=createxhr(); //創建ajax對象, 代碼見ajax | ajax封裝GET和POST
xhr.open('post','demo05.php');
xhr.setRequestHeader('Content-type','application/x-www-form-urlencoded');
xhr.onreadystatechange=function(){
if(xhr.readyState==4 && xhr.status==200){
var value=xhr.responseText; //返回的是字符串
//1)
var json=eval('('+value+')'); //返回是json對象
alert(json.username+json.password);
//2)
//var json=eval(value); //返回是json數組對象
//alert(json[1].name+json[1].age);
}
};
xhr.send(null);
</script>

返回："{name:’zhangsan’,age:18}"

解析格式：eval('('+value+')');

返回："[{name:'zhangsan',age:18},{name:'lisi',age:20}]"

解析格式：eval(value);

也可以采用eval('('+value+')');

實例1:

<html>
<head>
<title>新建網頁</title>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta name="description" content="" />
<meta name="keywords" content="" />
<script type="text/javascript">
function f1(){
//ajax去服務器獲得json信息
var xhr = new XMLHttpRequest();
xhr.onreadystatechange = function(){
if(xhr.readyState==4 && xhr.status==200){
//alert(xhr.responseText);//字符串{"north":"wolf","helan":"pig","germany":"dog"}
var info = eval('('+xhr.responseText+')');
//也可寫成：eval("var info="+xhr.responseText);
document.write(info.north);
document.write(info.helan);
document.write(info.germany);
}
}
xhr.open('get','03.php');
xhr.send(null);
}
//javascript把一個字符串變為對象
//var a = '{"north":"wolf","helan":"pig","germany":"dog"}';
//eval(參數字符串)
//eval("var obj="+a);//eval('var obj={"north":"wolf","helan":"pig","germany":"dog"}');
//document.write(obj);//訪問對象
</script>
</head>
<body>
<h2>靜態網站，javascript對json的接收處理</h2>
<input type="button" value="觸發" onclick="f1()" />
</body>
</html>
<?php
//對外提供json信息
header("Cache-Control:no-cache,must-revalidate");
$animal = array('north'=>'wolf','helan'=>'pig','germany'=>'dog');
echo json_encode($animal); //{"north":"wolf","helan":"pig","germany":"dog"}
?>

在javascript解析{"north":"wolf","helan":"pig","germany":"dog"}

采用：var info = eval('('+xhr.responseText+')'); 語法

也可寫成：eval("var info="+xhr.responseText);

實例2：

<html>
<head>
<title>新建網頁</title>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta name="description" content="" />
<meta name="keywords" content="" />
<script type="text/javascript">
function f1(){
//ajax去服務器獲得json信息
var xhr = new XMLHttpRequest();
xhr.onreadystatechange = function(){
if(xhr.readyState==4 && xhr.status==200){
//alert(xhr.responseText);//數組 ["wolf","pig","dog"]
var info = eval(xhr.responseText);
document.write(info[0]+info[1]+info[2]);
}
}
xhr.open('get','03.php');
xhr.send(null);
}
</script>
</head>
<body>
<h2>靜態網站，javascript對json的接收處理</h2>
<input type="button" value="觸發" onclick="f1()" />
</body>
</html>
<?php
//對外提供json信息
header("Cache-Control:no-cache,must-revalidate");
$animal = array('wolf','pig','dog');
echo json_encode($animal); //["wolf","pig","dog"]
?>

在javascript解析["wolf","pig","dog"]時

采用：var info = eval(xhr.responseText);語法

實例3:

<html>
<head>
<title>新建網頁</title>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta name="description" content="" />
<meta name="keywords" content="" />
<script type="text/javascript">
function f1(){
//ajax去服務器獲得json信息
var xhr = new XMLHttpRequest();
xhr.onreadystatechange = function(){
if(xhr.readyState==4 && xhr.status==200){
var s = "";
//alert(xhr.responseText);//數組對象[{"id":1,"name":"xutao","sex":"\u7537","age":30},...]
var info = eval(xhr.responseText);
for(var i=0;i<info.length;i++){
s += info[i].id + "--" + info[i].name + "--" + info[i].sex + "--" + info[i].age +"<br />";
}
document.getElementById("user").innerHTML = s;
}
}
xhr.open('get','info.php');
xhr.send(null);
}
</script>
</head>
<body>
<h2>靜態網站，javascript對json的接收處理</h2>
<input type="button" value="觸發" onclick="f1()" />
<div id="user"></div>
</body>
</html>
<?php
$info = array(
array("id"=>1,"name"=>"zhangsan","sex"=>"男","age"=>30),
array("id"=>2,"name"=>"lisi","sex"=>"女","age"=>27),
array("id"=>3,"name"=>"wangwu","sex"=>"男","age"=>6)
);
echo json_encode($info);
/* [{"id":1,"name":"zhangsan","sex":"\u7537","age":30},
{"id":2,"name":"lisi","sex":"\u5973","age":27},
{"id":3,"name":"wuwang","sex":"\u7537","age":6}] */
?>

在javascript解析[{"id":1,"name":"zhangsan","sex":"\u7537","age":30},

{"id":2,"name":"lisi","sex":"\u5973","age":27},

{"id":3,"name":"wuwang","sex":"\u7537","age":6}]時

采用：var info = eval(xhr.responseText);語法

從數據庫讀取出來的二維數組，通過json_encode()編碼后, 在javascript進行解析時也是采用上述語法。

在線咨詢

上一篇：JavaScript實現圖片跟隨鼠標的移動而移動
下一篇：HTML常用標簽

您的項目需求

*請認真填寫需求信息，我們會在24小時內與您取得聯系。

整合營銷服務商

程序員都應該了解的一種數據格式之 JSON

用法簡介

總結

您的項目需求