本期《城大商學院》雜誌討論大數據及資訊與通訊科技(ICT)在市場營銷方面的應用。多篇文章分別從獨特的角度探討ICT 為商業教育及研究帶來的危與機。這些文章讓我聯想到最近讀過的一本好書,就是湯馬斯·佛里曼(Thomas L. Friedman)《謝謝你遲到了:一個樂觀派在加速時代的繁榮指引》(Thank You for Being Late: An Optimist's Guide to Thriving in the Age of Accelerations)。憑藉多年記者生涯的薰陶和專業洞察力,佛里曼擅於從第一手資料歸納總結。加上多年來的暢銷著作給他帶來的名氣和人脈,佛里曼得以採訪各行各業的頂尖人才,探討各種技術的發展趨勢及其對當前商業運作的影響與衝擊,以獨特的角度,提出非一般的見解。
佛里曼引用了Google X 實驗室負責人Astro Teller 關於科技發展變化率與人類學習和適應環境變化能力的觀點。Teller 認為,數千年來科學和技術發展進程平穩,若以圖像表達,是以近乎直線型推展。一種新技術的出現要經過數百年才能得到廣泛應用,印刷和火藥概莫如此。但最近百年以來,科學技術的發展速度空前,每隔20 至30 年就會出現重大突破。到現在,一種新科技只需五至七年時間即可傳遍世界,而這種發展還在加速。一千年前,人類需要用一兩代人的時間去適應新的東西,現在只需10 到15 年的時間。面對科技迅速發展,人類需要強化適應科學技術發展和推動科技更新方面的學習能力。
由此我聯想到內地許多商界精英都積極學習,尤其熱衷於修讀各種高等學位課程。這也許是中國經濟在過去40 年高速發展的原因之一。
佛里曼準確地指出,2007 年是科技發展和大數據商業化的一個關鍵年份。當年推出的一系列產品和平台技術對隨後而來的大數據時代產生了極其深遠的影響。2007 年見證了第一款智能手機問世,也見證了開源式分佈運算平台Hadoop 的誕生。Hadoop 是根據Google 的歸檔系統(於2003 年首度發佈)和分佈式計算平台MapReduce(2004 年)這兩項發明開發而成的。由於Google 將其創新技術開放共享,Hadoop 這套公共領域運作的應用程式,不但能以廉價硬盤來存儲海量數據,在大量廉價機器組成的電腦節點群上採用並行計算方法對海量數據進行處理,而且提供一整套的數據庫管理與存儲檢索方法,以及監察計算節點之間的通訊。除此之外,該技術框架在設計時亦兼顧到硬件故障會不時發生,當發現處理節點出錯時,會將計算任務調度給其他節點承擔。有了這個開源式計算平台,便可在網上任何角落進行大數據分析,而非僅僅局限於大企業使用者。
隨著Hadoop 和開源軟件代碼分享平台GitHub 的持續創新和強化,我們看到市場上不斷湧現新的科技公司。Facebook、Twitter、LinkedIn、阿里巴巴、騰訊等巨頭都曾經採用Hadoop 來儲存和處理資料。Hadoop 的另一個重要貢獻,是它改變了大多數科技公司存儲和使用非結構化數據的方式。在Hadoop 出現之前,絕大多數企業都是採用甲骨文的關係型數據庫,以及搜尋語言SQL(Structured Query Language)進行數據庫的存儲、管理和查詢。編寫SQL 命令語句時,必須對數據存儲之前已確定的數據結構了然於胸。初期的SQL 無論是計算速度還是存儲容量都受到極大的限制,促使程式編寫員對數據庫的結構進行大量的設計優化工作以提升數據的存儲、閱讀和運算速度,Hadoop 便應運而生。Hadoop 能靈活處理數據,在系統開始讀取數據的時候才會確定數據庫的結構。
大數據通常有4V 特徵:體量(Volume,指數據集大小)、增速(Velocity,指數據體量的增長速度)、多樣性(Variety,指數據類型,例如文字、圖片、語音、視頻、點擊流等)和準確度(Veracity,指數據的可靠性)。大數據的體量和增速這兩個特徵可謂顯而易見,但大數據的多樣性實際上揭示了大數據時代的數據結構由結構化轉變為非結構化。結構化數據的存儲及運算在傳統的關係型數據庫中一直有長足的發展,但非結構化數據庫得以後來居上,除了因為靈活性,也因為非結構化數據的增長速度大大超出了結構化數據。數據的準確度指數據的可靠性、準確性和及時性,而這方面一直是大數據分析面對的最大挑戰,因為數據來源不可靠、不確定和不一致,以及使用者的先入之見,往往左右大數據分析的結論。Hadoop 為前三個V提供了有效的解決方案,而第四個V帶來的挑戰,則為統計學研究提供了開疆拓土的機會,有待攻克。
值得注意的是,大數據主要還是由發達國家和地區運用。麥肯錫最近一份關於數碼年代的國際數據流動(Global flows in the digital age)的調查報告,揭示了世界各國及地區的訊息流動狀況。數據運用和傳遞的前三強是美國、中國和德國,香港處於第二級,大致與日本或南韓相近;若從整體上看,大中華地區似乎有着領先趨勢,而中小企業是此輪技術創新的最大受益者。
更早之前,麥肯錫有一份報告(Internet Matters: The Net's Sweeping Impact on Growth, Jobs Prosperity, 2011年5月)就曾指出,互聯網技術已經讓中小型企業的出入口規模倍增。麥肯錫在前述的國際數據流動報告中特別指出,ICT 技術的應用對發展中國家的中小企業至關重要。舉例而言,智利的中小企業透過傳統渠道通常只能和大約三個國家建立交易關係,但通過網上平台則平均與28 個國家有進出口關係。
佛里曼的書詳盡地描述資訊科技的進步及所帶來的社會和環境方面的挑戰,但讀來總覺得意猶未盡。我們在8 月有幸邀得香港交易所的首席中國經濟學家巴曙松博士出席城大聯同北京清華大學舉行的EMBA + MPA 課程啟動儀式,並就「新經濟、新公融、新趨勢」的主題演講。演講中巴博士介紹了港交所即將推出的三項重大改革:簡化生物科技公司上市資格指引,允許上市公司設有不同投票權架構,以及為大中華及海外公司設立新的第二上市渠道。巴博士的演講特別強調資本市場是培養創新企業的搖籃,還進一步列舉歐洲和美國資本市場對於ICT 和生物醫學公司的投資數據。在美國,投入ICT 和生物醫學公司的總資本投資佔比高達73%,在歐洲則接近50%。
Total knowledge-intensive inflows and outflows, 20121
Relative area corresponds to the portion of global inflows/outflows
Share of eBay commercial sellers and offline SMEs1 that export, 2012
圖表源自《Global flows in a digital age: How trade, finance, people, and data connect the world economy》,2014年4月,McKinsey Global Institute,www.mckinsey.com。© 2018 McKinsey & Company 版權所有。本刊獲准轉載。
巴博士亦分享了一個關於在港上市內地公司的地域分佈觀察。北京、上海及廣州是到港上市公司數目最多的內地城市,他發現這三個城市均在生物醫學研究方面擁有雄厚的核心實力,而其他兩個先進城市深圳及杭州則較注重ICT 的發展。巴博士這個觀察也許是提振香港士氣的一個好消息,顯示出互惠雙贏的局面。一方面香港具有世界一流的醫學院及高效的醫院系統,而城大近期又開設了一流的動物醫學院;另一方面,毗鄰的深圳以ICT 創新聞名,可與香港形成互補。若能大膽創新,生物醫學或會成為香港推動大灣區發展的獨特新領域。
巴博士的原意也許是要喚起香港大眾對生物醫療業的重視,也許是要表達他對香港目前傑出的醫學院和醫院系統的厚望。由於佛里曼新書對生物醫藥技術以及ICT 技術和其他技術的融合未作深談,在這方面,Yuval Noah Harari 的新書《21世紀的21堂課》(21 Lessons for the 21st Century) 的論點藉得參考。與佛里曼的新書不同,Harari 這本書將科技、環境和核戰爭視為當今世界面臨的最大挑戰。
Harari 在書中強調ICT 技術和生物科學技術的結合,認為其間將發生有趣的相互影響。作為歷史學家,Harari 指出土地是過去數千年最重要的資源,而機器則是過去200 年最重要的資源。人們從過去的實踐中已經學會如何管理土地和機器,但在當今社會以及不久的將來,ICT 技術和生物科學技術的整合將對人類產生深遠影響,人類的數據將大大改變人類未來的發展方向。沿着這一思路,誰擁有人的數據誰就擁有資源。Harari 認為人類擅長於工程,但對自己的工程將產生怎樣的結果卻並非胸有成竹。他以築壩為例,指出人類數千年前就開始建造水壩,如今水壩越造越大、越造越快,但水壩會如何影響環境和氣候,至今仍然茫然無知。
在大數據年代,加深對數據的認識尤為重要。除了能掌握高性能電腦系統和不斷發展的人工智能技術以駕馭和管理數據,也要認識到數據迅速增加的速度以及其極大的可複製性。這些與如何管理數據大有關係。新生的一代在掌握技術的同時,還需要充分了解數據技術對經濟、社會和個人的影響。城大商學院已經充分認識到這股科技發展對商學院的教學和科研帶來的機遇和挑戰,近年來更先後推出計算金融和金融科技兩個新的專業。這兩門專業高度融合不同學術領域,涵蓋了大量關於電腦科學與數據分析和統計方面的培訓。城大商學院計劃以這兩個專業為起點,將這些課程推薦給全院本科生,讓我們的學生厲兵秣馬、準備就緒,迎接將來數據科技給商業和經濟提供的機遇和挑戰。