澳門開放了數據,然後呢?

/ 0 評 / 10

對於澳門開放數據這個問題,數年前曾就為此撰文,欲建智慧城市 澳門應開放數據

但三年後的今天,仍有話要說。

當時澳門仍未有官方正式的開放數據,在2019年的最後一天,官方終於推出了「澳門特別行政區政府數據開放平台」https://data.gov.mo (下稱數據開放平台)。

聽聞這個消息,作為本澳的資訊業界人士且一直關注這個開放數據的我,抱著相當的期望,第一時間進行試用。

經過一番操作後,發現仍有相當大的改進空間,當時心想該平台還是初建立,再觀察一段時間吧,應該會不斷完善,經過數年後,大部份情況仍如最初。

先看看2022年的5月,數據開放平台所提供的數據集類型

數據開放平台合共向外提供之數據集總數為 584 個,由35個部門/實體 共同提供,覆蓋社會各個方面,便於檢索,在數據分類上合理。

缺少巴士及其他公共交通數據

在整個智慧城市中,交通是當中最重要的一環,而公交在交通部份更是核心,對數據開放亦如是。

先說巴士,在數據開放平台發佈這兩、三年間,巴士的開放數據至今只有

(巴士路線資料、公共巴士站總數、巴士數量、巴士司機數量、低地台巴士數量、備有輪椅停靠設備的巴士數量)

這 6 項,而其中 6 項中,有 5 項是一些數量統計且只為每季更新,實際上這批數據集的可應用程度並不高。

能較大程度利用的也只有巴士路線資料這一個,但仍遠遠不足夠。

其實,於實際應用層面,巴士數據除了基本路線資料外,巴士實時位置、到站情況、車廂擁擠程度、座位使用率、過橋時間、平均候車時間等這些數據更為有用。

這些最實用的數據卻至今仍未有提供開放。

      

另外,輕軌亦是澳門未來公共交通當中的一部份,在目前已開放的數據集中,其中並沒有任何一條相關數據集。

而公共交通部份中的其他數據集,大部份屬於一些統計數值,而且大都是每季更新。

實時或需要更新頻率較高的應用數據(如每天、每小時、每分鐘、每10秒...)等數據卻不多。

沒有實用、可應用性較高的數據集,試問如何組合出有價值的應用,達至開放數據的理想效果?

API 數據接口數量少

在2022年5月,數據開放平台對外提供之數據集之方式,主要透過 API、檔案、網址三種方式 提供。

當中 API 部份僅有30個,佔數據集總數約 5%,而以檔案形式提供是當中最大一部份,有544個,佔總數約 93%,網址部份有17個,佔總數約 2.9%。

個人認為開放的數據集最終以什麼形式及更新頻率向使用者提供,這很大程度取決於該數據集的性質、對時間性的要求等多種因素,而並非要求所有數據集都一定要以 API 形式提供,但如果有,更佳。

舉例:目前在公共交通部份的API,共有 停車場資料、停車場車位資訊 兩組數據集;

其中停車場車位資料相對「動態」,本澳各個停車場出輛出入頻繁,車位數量均會不斷變化,各項數據更新頻率「高」,每10秒更新一次,設置合理。

停車場資料相對「靜態」,每個停車場的資料(例如:中文名稱、位置、出入口位置、聯絡電話、GPS座標、收費等等)各項數據更新頻率相對「低」,但更新頻率同樣地每10秒更新一次。

以 API 形式提供數據,對資訊業界、開發人員友好,可應用價值較高,但數據更新頻率的考慮上能有進一步的優化空間。

在當前總數達 584 個數據集中的,以 API 形式提供的數據集卻僅有 30 個,而公共交通僅且只有 2 個…

缺少自定義數據輸出格式

以上圖表為當前數據開放平台上所提供之數據格式及各格式之數量

各項數據集提供的數據格式不一,如能提供自定義切換數據格式。

舉例同一份數據集,預設是 .xlsx格式,如需 JSON 格式,可傳入參數隨時調整而取得相應的數據格式,

更便於資訊業界、開發者對數據集按各自喜好進行處理。但目前仍然欠缺該選項。

部份 API 調用地址欠缺規範、文檔說明不足

在概覽各項數據集的過程中,發現了一些問題。

API地址命名欠缺意義、可讀性

例如:由勞工事務局所提供的「批准外地僱員聘用許可及持外地僱員身份認別證(藍卡)的數目及比率」API 中

有沒有發現當中的調用地址為 https://dsal.apigateway.data.gov.mo/aaaaa

其中 aaaaa, 可以看到與該項數據集無關,亦欠缺意義,嘗試調用該API,亦返回錯誤(504),無法正常使用。

API 調用地址欠缺規範、文檔說明不足

在總數據集中,有17項所提供的形式是網址。

這批數據集由氣象局提供,主要提供各項氣象數據。

在當中各個數據集的說明頁面中,亦僅只提供網址,並未有就各項輸入輸出參數的名稱、類型、長度等像其他部門所提供之數據集內容作出說明。

若使用者想使用該數據集,當中各項資料欄位只能靠猜。

個人認為,在數據開放平台,共享數據,這類型欠缺文檔說明的API接口,這明顯不合適亦不合理。

在整總數據集的收集和整理中,統一接口規範相當重要,不能只有部份有、部份卻沒有。

應宣傳及鼓勵提供、使用開放數據

數據開放平台推出後,除了官方新聞稿外,就並沒有太多主動宣傳、活動、比賽等形式,鼓勵使用,本澳的資訊業界對之了解甚少。據個人非正式統計,在三年後的今日,與部份業界朋友、開發者、科研人員溝通,知道有這個數據開放平台的比例亦只有大約50%,當中實際使用到亦不足30%,即只有一半人知道。建議官方相關部門可以多向大眾(尤其資訊業界、開發者、科研人員等)多做宣傳推廣使用,收集實際反饋,不斷優化。

另一方面,應鼓勵作為數據集的提供方(各部門/實體)提供更多具有應用價值的數據集,而非純「交功課」形式提供應用價值不大的數據集或一些統計數值。由於各部門/實體的功能性質上截然不同,如以數量來衡量該部門/實體對數據開放的積極性,這並不是最公平的選項,而是對於所提供之數據集的實用應用價值、數據格式、穩定及可用性、實際使用人數等作多方面綜合衡量因素。

宜增設應用展示及公開評論

數據開放平台,究竟數據開放的作用為何?究竟能夠用來做什麼?未必所有瀏覽這個平台的人都會知道,如果能夠增加一個應用展示專區就能夠很好地說明這個問題,在這個專區內分享一些使用數據開放平台所提供的數據建立的應用程式,簡單敘述能夠讓大眾對數據開放有更清晰的理解,亦能夠進一步普及使用率。

另外可以在每個數據集來增加評論或者意見反饋功能,讓使用者提問,並將跟進回覆公開,進一步令數據開放更透明,增加使用者信心及體驗。

總結

澳門的開放數據,一直都是個人其中一個比較關注的問題,三年多前曾撰文說明其重要性及迫切性,隨後一段時間,官方推出數據開放平台,試用後,發現雖然可用,但可實際應用價值不算高,更有部份數據集屬於「搬字過紙」的統計數據/超連結,不過細想當時仍處於初期階段,就不作細說。經過一段時間的觀察及使用,一些從初期已存在的問題,至今仍未處理或優化。例如最重要的公共交通部份,以API形式提供的接口僅有2個,對於巴士數據部份,大部份極具應用價值的數據集卻不見蹤影。另一方面,以 API 形式提供的數據集只有30個,僅佔總數據集中的5%。同時仍欠缺對數據集輸出的格式自定義設定,無法自行選擇所需輸出的格式。在實際使用部份 API 調用地址時,發現欠缺規範,API 地址竟然會出現 aaaaa, test 等無意義或用於測試用途的字眼,實屬不解。而以網址形式提供大部份的數據集,數據集中只有網址,並沒有各網址中接口內各項參數說明,文檔說明不足。同時官方推出數據開放平台後,應多作宣傳及鼓勵提供、使用開放數據,僅以新聞稿形式冷推出,更有部份資訊業界人士、開發者卻未有得悉此平台之存在。對大眾市民、一般用戶而言,數據開放的作用和實際用途,他們大部份都可能未必知道,故此亦應增加應用展示區域,讓大眾更容易清晰地理解數據開放的作用和重要性。

數據開放平台推出固然是好事,相關研發部門所付出努力值得肯定。

但從「有」到「優」這個階段,澳門的數據開放平台當前看來仍有很大的改進空間。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *