整合營銷服務商

          電腦端+手機端+微信端=數據同步管理

          免費咨詢熱線:

          一文讀懂全球化系統中的日期時間處理問題

          一文讀懂全球化系統中的日期時間處理問題

          oo long; didn't read:

          1. 大多數應用中,只需要用“絕對時間 DateTime”一種技術實現即可

          2. 后端應統一用 UTC 時間(包括 DB 落盤、接口定義),不應當受用戶時區或服務器時區的影響

          3. 前端輸入、展示的時間,根據具體業務場景進行時區調整,以及精度調整

          4. 面對不帶時間的日期,要明確區分「紀念日」與「精度不高的絕對時間」兩種用途,大部分時候你看到的日期是后者,它也應當用“確定時區的 DateTime”來實現

          1. 重要性

          日期時間的處理,一直是計算機系統中看似簡單,實則經常爆雷的問題。

          例如,每隔幾年,都會爆出的「千年蟲問題」的各種變種,通常因為系統在設計之初,沒有設計好日期時間的數據存儲方式,或者低估了產品設計的生命周期,導致最初選型的數據結構不夠用了。

          千年蟲問題:

          年紀大的程序員,都知道千年蟲問題。在 2000 年之前,很多系統用 2 位數字表示年份,這樣 99 年是它能表達的最大數值。因此 1999 年之后的一年,在這些系統中是沒有定義的,甚至可能出現多種奇怪的情況,例如“1900”、“1:00”、“19:0”(為什么?感興趣的讀者可以自己推測)。

          如果說,「千年蟲」是在時間維度上缺乏前瞻性的設計導致的,那么另一種缺乏前瞻性的問題,是空間維度的,即產品全球化、跨時區帶來的問題。

          全球化的產品中,如果時間的處理沒有遵循統一的標準,會讓整個系統充斥著難以理解和維護的時間轉換。各種接口的對接文檔,都不得不明確說明「這個接口的時間是什么時區的?需要如何處理?」后端服務如果需要跨國部署在多個大洲的機房時,因為服務器的時區不同,需要做大量的改造。

          遺憾的是,大多情況下,產品不會一開始就有「全球化」屬性。所以在一開始,產研團隊都不會重視全球化的設計問題,很容易留下缺乏前瞻性的設計問題。

          通常情況下,我們都不鼓勵「過度設計」。然而,日期時間的設計,是最不怕「過度」的。這時因為,在技術上實現一個前瞻的時間日期方案,成本并不高;但如果一開始的設計不夠,后期的升級和數據遷移工作,卻是傷筋動骨的。

          2. 如何表達時間和日期?

          2.1 時間日期的傳遞:用字符串

          在微服務之間,以及在前后端之間,建議用字符串傳遞日期時間。字符串清晰易讀,易于人工調試,帶來的開銷通常也完全可以接受。(帶大量時間數據的接口,建議考慮用 Unix Timestamp。)

          如果用字符串,格式就不要自己發明了。有個非常明確的國際標準:ISO 8601(wikipedia: https://en.wikipedia.org/wiki/ISO_8601)

          下面舉例是符合規范的常用格式:

          • 僅日期:2022-02-09
          • UTC 日期時間:2022-02-09T12:36:42Z
          • 特定時區的日期時間:2022-02-09T20:36:42+08:00
          • 精度更高的時間:2022-02-09T12:36:42.123456789Z

          注意,MySQL 中使用的字符串格式(如 2022-02-09 12:36:42)并不符合規范,不建議使用。

          2.2 時間日期的存儲:關注 MySQL 中的 DateTime

          不同數據庫在時間日期相關對象的處理差異很大。這里單說 MySQL,因為坑不小。

          MySQL 的 DateTime 數據在存儲時并不包含時區信息,因此,在讀取時也不會做任何時區的轉換。

          同時,每個 MySQL 連接會話,都有「會話時區」的概念,但這個概念只影響 MySQL 的 NOW() 等有關當前時間的函數的行為,對數據中已經保存的 DateTime 沒有任何影響。

          例如:

          SET time_zone='+00:00' ;
          UPDATE tab SET datetime_colume='2020-01-01 00:00:00';
          SET time_zone='+08:00' ;  -- 換一個會話時區
          SELECT datetime_colume FROM tab;
          -- 返回值仍然是 '2020-01-01 00:00:00',和寫入的數據一致,和會話時間無關
          
          ---------
          SET time_zone='+00:00' ;
          SELECT NOW();   -- 假設返回 '2022-01-01 00:00:00'
          UPDATE tab SET datetime_colume=NOW();   -- 存入的是 '2022-01-01 00:00:00'
          SET time_zone='+08:00' ;  -- 換一個會話時區
          SELECT NOW();   -- '2022-01-01 08:00:00' 根據時區變化了
          SELECT datetime_colume FROM tab;   -- '2022-01-01 00:00:00' 已經寫入的不會變

          2.3 時間日期的計算:語言原生的 DateTime 類型

          各語言一般都提供了原生的 DateTime 數據類型,以表達絕對的日期時間,并且都支持上面 ISO 8601 規范的解析和格式化。

          處理相對時區時,各種語言通常都是使用操作系統的時區數據庫,來轉化為絕對時區。時區數據庫需要在聯網情況下,由操作系統負責定時更新。

          2.4 萬能的 Unix Timestamp

          Unix Timestamp 在存儲、計算、傳遞環節都可以使用,可謂萬能。它唯獨不適合表達紀念日日期。

          它通過一個數值表示了一個絕對時間與 Unix Epoch 時間(定義為 1970-01-01T00:00:00Z)的差值秒數。Unix Timestamp 本身已經表達了絕對時間,并不需要時區信息。

          使用 Unix Timestamp 時,應特別注意選用合適的數值類型,它會影響時間表示的范圍。稍不留神,你就可能種下一個新的千年蟲。

          • 用有符號int32,最多表示到 2038 年。MySQL 的 TIMESTAMP 類型也是它,一個千年蟲變種
          • 用有符號int64,并使用 9 位 10 進制定點小數位時,就是 Golang 的UnixNano(),可以表示 1678 年至 2262 年
          • 一般不會用浮點數表示,因為浮點數的精度不固定

          3. 產品視角的日期時間設計

          本著不重不漏的原則,我們可以按如下表格劃分產品中的所有日期時間對象:


          日期+時間

          僅時間

          僅日期

          不指明時區,無需根據用戶所在時區做轉換

          ① 表示本地的確定時間點

          ③ 表示本地重復性時間

          ⑤ 表示紀念日、節日

          指明時區,需根據用戶所在時區做轉換

          ② 表示全球唯一確定時間點

          ④ 表示全球可理解的重復性時間

          ? 不存在的場景

          下面逐一解釋這五種場景。

          3.1 表示全球唯一確定時間點(表中的 ②)

          信息量包含「年月日-時分秒-時區」。這樣,就可以完全確定歷史長河中的一個無歧義的時間點。這個時間點是完全客觀的,和訪問的用戶地理位置無關,和服務器的地理位置無關,和什么都無關。

          產品表現上,通常會根據查看者所在的時區來重新調整時間的顯示。

          用途舉例:

          • 單個事件發生的時間。如 2022 年冬奧會開幕式的時間:2022 年 2 月 4 日,20 點整,+0800 時區。一個英國人看電視轉播預告時,會看到開幕式的轉播時間是:2022 年 2 月 4 日中午 12 點整。這體現了根據查看者做時間的轉換。

          3.2 表示本地的確定時間點(表中的 ①)

          包含「年月日-時分秒」,因為沒有時區信息,所以它本身并不能確定一個精確的時間點,而是只在特定的情境下才有意義。

          所謂特定的情境,是因為業務場景中蘊含了時區的信息,并且是大家公認的共識。因此,本質上它仍然表示了一個絕對時間。在產品表現上,因為對時區的共識,所以不需要根據查看者的時區來調整時間的展示。

          用途舉例:

          • 在非國際化的產品中,明確知道用戶所在的時區,那么去掉時區是最簡單的處理方式,可以省去很多麻煩。
          • 對于時區有其他約定俗成的理解。例如:飛機的起飛降落時間,酒店的入住離店時間,一定是按照飛機起落地、酒店坐落地當地時區來表達的。在所有訂票網站上,都會按照這個規則顯示時間,不論訪問的用戶身處哪個時區。

          3.3 表示重復性時間(表中的 ③ 和 ④)

          和前兩類相比,去掉了「日期」這個信息,是為了描述重復性的日程。它可以是指明了時區的,也可以不指明時區,而基于人們對時區的共識去理解。

          用途舉例:

          • 每周三 8:00+0800 開會,如果這可以是個跨國的會議,大家都能理解正確的時間。這時,產品表現上應該注意根據查看者來調整顯示。
          • 每周三 8:00 起飛的航班,航班起飛地的時區是蘊含的共識。產品表現中不必根據查看者的時區調整顯示。

          3.4 紀念日日期(表中的 ⑤)

          日期對象幾乎只有一個有意義的用途:表示紀念日/節日。它不會包含時區信息。

          認為「日期」只能用于「紀念日」,有些絕對了。但我確實查閱了很多資料,也沒有看到任何非「紀念日」用途的日期。

          例如:

          • 小吳的生日是 3 月 11 日,那么不管他在中國還是美國,都會在 3 月 11 日這一天過生日。
          • 每年 12 月 25 日是西方的圣誕節,各個國家都在 12 月 25 日這一天慶祝,雖然它們并不在同一個時區。

          產品體現上,不需要根據時區調整日期的顯示。本質上,「紀念日」的邏輯,其實是人腦的不嚴謹導致的一種習慣,是不嚴謹、不客觀的習慣。不包含時區信息,就是為了滿足這種不嚴謹的習慣。

          3.5 區分「紀念日日期」與「精度不高的絕對時間」

          上面說過,日期對象不能包含時區。你可能會問,我需要表示“北京時間 2022 年 3 月 22 日”呢?答案是:這不是一個日期,而是一個「精度不高的絕對時間」。

          很多情況下,當你想用日期時,其實很可能需要的是個「精度不高的絕對時間」。在飛書人力套件的業務中,經常會遇到這種場景。

          例如,一個在美國的同學與一個在日本的同學,都在 2022 年 3 月 22 日這天從公司離職了,由同一個在北京的 HR 辦理離職事項。


          可見,從我們用戶視角理解的「一個事件發生的日期」,其實是我們忽略了時間的精度。在產品全球化之前,我們通過一些默認的簡化,忽略了時間精度的問題(例如把時間都填成 00:00:00)。一旦面臨產品的全球化,就需要補齊時間、提高精度。

          而補齊時間、提高精度的方式,需要根據具體的產品形態具體考慮、明確定義。

          例如,在上述離職場景下,就需要按照這個公司對離職的定義來補充,可以是當地時間當天的 23:59:59,也可以是當天下班時間,如 17:00:00。

          又比如,對于跨團隊的業務,例如一個同學的上級匯報線從一個美國 Leader 轉到一個日本 Leader,那么為了避免歧義,通常會約定一個確定的生效時區,如統一按照公司的總部所在地的時間來計算。

          4. 日期時間的技術實現

          4.1 確定時區的 DateTime

          適用于上面的 ①②③④ 四種場景。

          所有后端暴露的接口中的時間對象,全部以 UTC 時間表示。

          同時,所有后端在存儲、計算、傳輸時間時,也統一使用 UTC 時間。由于 DB 存儲時間時,時區信息會被丟掉,因此應保證丟掉的時區,是大家明確約定清楚的無歧義的,即 UTC。這樣一來,DB 中的所有時間字段也都沒有歧義。

          接口內部產生的時間,例如 CreatedAtUpdatedAt時間,都應該轉換為 UTC 再落盤。如果直接使用了 MySQL 的NOW()函數,應確保 MySQL Session 的時區設置正確。

          在前端或 BFF 負責處理用戶輸入的時間,以及展示給客戶看到的時間。包括兩個步驟:

          1. 處理“精度不高的時間”問題。 比如:員工異動的生效時間,用戶只設置到“天”的精度。那么如果不跨國,可以補全用戶會話時區的 00:00:00 為精確生效時間;如果跨國,那就看客戶如何定義,以及產品給客戶怎樣的靈活性:例如,可以以客戶公司總部所在地的時區的 00:00:00 為精確生效的時間。
          2. 時區轉換。 注意,這里不一定是使用用戶的會話時區來轉換。如前面介紹的飛機火車賓館的預定時間,就要以預定當地的時區來轉換。

          上述兩點,是一定需要在產品設計中定義清晰的,切忌含糊不清。

          不要較真兒抬杠的幾點:

          由于歷史原因,DB 里已經采用北京時間保存了,那么我們可以約定+0800 時區是我們所有后端接口的時間。只要用一個確定的絕對時區,就不會有歧義,不必非要時 UTC。

          也可以在后端接口的網關層處理時間轉換。不要較真那算不算 BFF,我們需要的是,時區轉換邏輯應嚴禁深入到后端的下層去。

          4.2 不帶時區的 Date

          適用于上面的 ⑤,即紀念日場景。

          輸入或展示時,都不對日期做任何處理。日期對象直接保存在 DB 中。

          只有真正的紀念日有必要用這種方式,應當非常謹慎。例如保存一個聯系人的生日時。

          5. 關于時區的特殊處理

          5.1 時區的不確定性

          使用絕對的時差來表示時區,例如:“東 8 區”表示比世界協調時間(UTC)早 8 個小時的時區。這是個客觀的時區。

          很多時候,我們關注的是一個城市或地區的時區。例如:Asia/Shanghai 表示中國時間;三字母的縮寫 EST 表示美國東部標準時間。注意,這些根據地理位置定義的時區的時差是會發生變化的,變化因素包括:可能受到當地政策的影響,或夏令時影響。

          對于歷史的時間,地理時區是可以確定客觀時區的,因為沒有人會重新定義已經過去的時間。

          對于未來的時間,地理時區并不能確定客觀時區。因此,如果一個未來的事件是按照非絕對時區約定的,那么它很可能變化。并且,我們的產品需要考慮到處理這種變化。

          例如,中國員工發起一個“每天早 8 點”的跨國會議,那么在美國,由于夏令時的改變,冬天開會的時間和夏天是不一樣的。反之,美國員工發起的一個“每天早 8 點”的跨國會議,由于美國夏令時的變化,對中國員工的時間也是夏天和冬天不一樣的。

          5.2 夏令時

          某些國家在夏天,會把時間調快一小時(提前一小時)。這表現為,同一個地區,在冬天和夏天用不同的絕對時區。

          這樣做,是因為夏天白天很長,調整后會在白天的更早的時段上班,從而下班后有更長的天亮的時間。注意,并不是把 10 點上班調整到 9 點上班,而是全社會重新定義了 10 點提前了一小時。

          一個具體的例子,在美國:

          在 2021 年 3 月 14 日凌晨 1:59:59 后,下一秒就是凌晨 3:00:00。因此,美國的 2021 年 3 月 14 日凌晨 2:10:00 這個時間實際上不存在。為了兼容,根據 RFC5545,如果日程約在了這個不存在的時間,會認為是 3:10:00。

          在 2021 年 11 月 7 日凌晨 1:59:59 后,下一秒是凌晨 1:00:00。因此,美國的 2021 年 11 月 7 日凌晨 1:10:00 這個時間實際上會出現兩次。為了避免歧義,根據 RFC5545,看到這個時間時,會認為是靠前的時間點。因此,除非用別國的時區來約日程,否則,美國老板是不可能約你在重疊的第二個小時內開會的。

          閱讀更多及參考文獻

          • Wikipedia: ISO8601 - 用字符串表達各種時間對象的標準

          https://en.wikipedia.org/wiki/ISO_8601

          • RFC3339 - 互聯網上關于時間和日期實現的通用建議

          https://www.rfc-editor.org/rfc/rfc3339

          • RFC5545 - iCalendar 互聯網日歷應用的規范

          https://datatracker.ietf.org/doc/html/rfc5545

          • Stackoverflow: Daylight saving time and time zone best practices [closed] - 技術實現建議

          https://stackoverflow.com/questions/2532729/daylight-saving-time-and-time-zone-best-practices

          • Stackoverflow: How to store repeating dates keeping in mind daylight saving time - 技術實現建議

          https://medium.com/@vivekmadurai/how-to-deal-with-date-and-time-across-time-zones-39b1bd747f35

          • Medium: How to Deal with Date and Time across Time Zones - 技術實現建議

          https://medium.com/@vivekmadurai/how-to-deal-with-date-and-time-across-time-zones-39b1bd747f35

          • Microsoft365: Behavior and format options of the Date and Time field - 微軟的時間和日期字段的文檔

          https://docs.microsoft.com/en-us/dynamics365/customerengagement/on-premises/customize/behavior-format-date-time-field?view=op-9-1

          • Time Change 2021 in the United States - 美國 2021 年夏令時的調整方式

          https://www.timeanddate.com/time/change/usa?year=2021

          我們對 Joda 日期對象進行轉換的時候,我們需要將 joda 設置時區,這樣才能針對不同的時區輸出正確的日期格式。

          時區的設置是在:

          logger.debug("dateTime for EST is - [{}]", dateTime.toDateTime(DateTimeZone.forID("America/New_York")));

          中的方法 DateTimeZone.forID 方法中進行設置的。

          這個方法使用的參數是字符串,因此你需要定義你需要的字符串。

          時區字符串

          時區字符串從哪里來呢?

          請參考下面的鏈接:https://www.joda.org/joda-time/timezones.html

          可以參考的字符串可以從上面的鏈接中找到。

          你也可以參考上面的表格,找到你需要設置的時區。

          avaScript 日期

          • JS 數組迭代
          • JS 日期格式



          實例

          var d=new Date();

          親自試一試


          主站蜘蛛池模板: 日韩视频在线一区| 国产精品亚洲一区二区三区在线| 精品亚洲AV无码一区二区| 成人精品视频一区二区三区尤物| 久久综合一区二区无码| 男人的天堂av亚洲一区2区| 日本一区二区三区精品中文字幕| 免费在线观看一区| 国模一区二区三区| 欧美人妻一区黄a片| 亚洲丰满熟女一区二区v| 亚洲AV美女一区二区三区| 香蕉视频一区二区| 亚洲一区视频在线播放| 乱人伦一区二区三区| 国产丝袜一区二区三区在线观看 | 本免费AV无码专区一区| 国产aⅴ一区二区三区| 国产精品一区二区资源| 国产Av一区二区精品久久| 无码少妇一区二区浪潮免费| 国内精品一区二区三区东京| 无码国产精品一区二区免费式影视| 无码精品一区二区三区在线| 国产精品视频第一区二区三区| 中文字幕日韩人妻不卡一区| 久久精品国产一区二区电影| 一区二区三区四区精品| 一区二区精品在线观看| 国产精品亚洲综合一区| 国产亚洲情侣一区二区无码AV| 国产午夜精品一区二区三区小说 | 亚洲一区二区三区在线网站| 亚洲一区免费视频| 韩国福利一区二区三区高清视频 | 日韩精品乱码AV一区二区| 国产a∨精品一区二区三区不卡 | 中文字幕在线观看一区二区 | 三上悠亚一区二区观看| 国产一区二区电影在线观看| 亚洲综合一区二区精品导航|