loading...
少年時,曾研習 Geographic Information System,可惜學無所成,僥幸畢業。成年后,誤打誤撞進入傳媒圈子,先后在印刷、電子、網絡媒體打滾,略有小成。中年后,修畢信息科技碩士,眼界漸擴,決意投身初創企業,窺探不同科技領域。近年,積極鉆研數據分析與數碼策略,又涉足 Location Intelligence 開發項目;有時還會抽空執教鞭,既可向他人分享所學,亦可鞭策自己保持終身學習。
當Google跟微軟、OpenAI在AI領域斗得天昏地暗之際,亞馬遜終于按捺不住,正式宣告加入AI戰團,但不是發表像ChatGPT般的AI應用,而是推出AI開發云端平臺和大型語言模型,方便企業客戶制作自家AI軟件。另一邊廂,不斷公開反對OpenAI的科技狂人馬斯克,正在籌組新AI公司“X.AI”,更會開發名為“TruthGPT”的聊天機器人,看似有意跟OpenAI和ChatGPT一決雌雄。隨著亞馬遜、馬斯克相繼入局,會對生成式AI市場帶來什么沖擊呢?
Bedrock平臺式服務簡化AI開發
2023年4月13日,亞馬遜(Amazon)旗下全球最大云端服務供貨商AWS宣布,針對企業客戶推出AI平臺式開發服務“Bedrock”和自家基礎模型“Titan”,讓開發團隊能以較簡單而低成本的方式,部署生成式AI應用。
AWS發表Bedrock開發平臺和Titan基礎模型,幫助企業客戶簡易地開發出聊天機器人或文生圖的服務。(圖片來源:Amazon官網)
AWS表示,客戶可視乎其開發取向而選擇合適的基礎模型,跟著用自家公司數據訓練出專屬的AI模型,然后透過AWS工具把模型整合到自有AI應用。至于AI市場龍頭OpenAI,亦有提供類似服務,容許企業客戶因應業務需要而微調模型。
在Bedrock平臺上,客戶可通過API使用4個不同的基礎模型:由前OpenAI員工成立的美國AI初創Anthropic,旗下“Claude”模型可執行多種對話和文本處理任務,宣稱是誠實且負責任的AI系統。來自以色列初創AI21 Labs的“Jurassic-2”,能夠生成多國語言文案,包括:法語、德語、意大利語、荷蘭語、西班牙語、以及葡萄牙語。來自英國初創Stability AI的“Stable Diffusion”,能夠產制高質圖像、商標和其他設計圖等。
OpenAI前研究副總裁達里奧?阿莫迪(Dario Amodei)因公司發展方向與其他同事有意見分歧,于是決定自立門戶,2021年創辦Anthropic,旗下主打產品“Claude”已被AWS納入為Bedrock平臺上可供選擇的基礎模型之一。(圖片來源:Anthropic官網)
以色列AI初創AI21 Labs于2022年取得6,400萬美元(約4.99億港元)融資,并于2023年1月推出一款AI寫作工具,其背后模型也被納入Bedrock平臺。(圖片來源:AI21 Labs官網)
英國AI初創Stability AI的估值高達40億美元(約312億港元),主要產品為“Stable Diffusion”圖像生成器,其AI模型亦已加入Bedrock基礎模型行列。(圖片來源:Stability AI官網)
至于亞馬遜自家的“Titan”,內含兩個大型語言模型,分別提供兩項功能:“文本生成”,適用于研發開放式問答、以及生成文案服務等;“文本嵌入”,可以將文字輸入轉換成包含語義的數值,適用于開發個人化服務、推薦、以及搜尋等。
客戶數據絕不用于AWS模型訓練
Bedrock客戶不用自建服務器,便可以直接基于Titan或其他模型來創建AI應用,有助減省整體開發成本。AWS承諾,客戶輸入至Titan的數據,只會留在自家平臺上,而不會充當Titan的訓練數據,避免公司機密外泄。此外,Titan可以偵測和移除數據中的有害內容,又可以拒絕用戶輸入不當或低俗內容,更可以過濾模型本身產出的仇恨言論、色情和暴力內容等。
亞馬遜新任執行長的安迪·賈西(Andy Jassy)在寫給股東的信中,強調該公司現正積極投資大型語言模型和生成式AI技術,預期這項投資足以讓Amazon往后幾十年在各個業務領域均可進行創新。
盡管亞馬遜不像Google和Microsoft般,能夠搭配搜索引擎和字處理軟件來推展AI應用,但該公司作為電商和云端服務龍頭,不僅掌握巨量的網購數據,在云端運算方面也有很強的競爭力,故此AWS在這場AI競賽中仍是非常強勁的對手。
Twitter購1萬枚GPU供AI運算
不過,或許有一個更強的挑戰者即將登場——身兼特斯拉(Tesla)、SpaceX與Twitter執行長的埃隆·馬斯克(Elon Musk),也有意投入生成式AI開發。網媒《Business Insider》報道指,Twitter已向輝達(NVIDIA)采購約10,000枚圖像處理器(GPU)供AI運算之用。據聞,Open AI為訓練GPT-4模型,花費了1億美元(約7.8億港元)購入10,000枚NVIDIA A100圖像處理器。
有報道指,Twitter已向NVIDIA購入10,000枚GPU,暫時還不清楚采購了哪個型號,但外界估計有可能是NVIDIA A100的后繼產品“H100”,在相同功率下指令周期能比上代快上好幾倍。(圖片來源:NVIDIA官網)
除此以外,Twitter也在招聘新的AI工程師。較早前,該公司從Google母公司Alphabet旗下AI實驗室DeepMind挖走科學家巴布斯金(Igor Babuschkin),主掌新AI項目發展。外界預期,Twitter將利用自家社群平臺上的數據來訓練模型,惟其發展AI的真正意圖尚未明朗,既有可能是改善Twitter搜尋功能,又有可能是幫助客戶生成廣告內容,以提振廣告業務。
馬斯克從2023年2月以來一直找尋AI人才,近日成功從DeepMind挖走科學家Igor Babuschkin與6名工程師,加入其AI開發團隊。圖中為DeepMind倫敦總部。(圖片來源:維基百科)
更叫人吃驚的是,作為OpenAI前創辦人之一的馬斯克有意另起爐灶,創立一家全新AI公司直接與OpenAI競爭;他已開始向特斯拉和SpaceX的投資者尋求更多資金,用作啟動新公司。
馬斯克新公司X.AI挑戰OpenAI
根據內華達州的企業記錄,一家名為X.AI的新公司已于2023年3月9日注冊成立,馬斯克是公司唯一董事,負責營運馬斯克家族辦公室Excession的賈里德·伯查爾(Jared Birchall)則出任新公司秘書。馬斯克早前已將Twitter并入其私人公司X Corp.,現今再加上X.AI,似乎與傳聞中他欲創建萬能App(Everything App)“X”的愿景一脈相承。
Twitter公司現已被合并到X Corp.,馬斯克直言他的最終目標是創建萬能App“X”,并重申Twitter是實現此目標的催化劑。未知這個App日后跟X.AI公司與Twitter將會產生什么化學作用呢?(圖片來源:維基百科)
2023年4月17日,馬斯克接受《??怂剐侣劇罚‵ox News)專訪時首度承認,將會開發一個名為“TruthGPT”的AI聊天機器人。馬斯克形容,TruthGPT是致力于追求真相、試圖理解宇宙本質的AI。他認為,人類是宇宙中有趣的一部分,而一個了解宇宙的AI不太可能消滅人類,所以它會是一個安全的AI。
此外,馬斯克又狠批,OpenAI已從非牟利組織變成只顧圖利的企業,不再開放原始碼,并跟微軟(Microsoft)的商業關系過于緊密。事實上,馬斯克一直公開反對他有份創辦的OpenAI,早前更帶頭簽署公開信,呼吁全球AI實驗室暫停訓練比GPT-4更強大的模型起碼6個月,被視為針對OpenAI的舉措。如今馬斯克揚言要開發TruthGPT,更被外界認為這是向ChatGPT宣戰的新動作。
馬斯克一邊呼吁暫停生成式AI開發,一邊卻創辦X.AI公司,進入生成式AI市場。究竟這是出于炒作,還是因為當初錯失OpenAI而現在心有不甘呢?(圖片來源:Twitter@elonmusk賬戶)
OpenAI擬落戶日本拓亞洲業務
面臨愈來愈多挑戰者涌現,OpenAI亦不敢怠慢,力求拓展業務版圖。該公司執行長山姆·阿爾特曼(Sam Altman)于2023年4月10日親赴日本,跟首相岸田文雄會面。他表示,看好ChatGPT在日本的發展前景,希望在當地開設辦公室,建立適合日本民眾、文化和語言的AI模型。
日本內閣官房長官松野博一表示,首相岸田文雄已就AI技術的優點,以及可能帶來的私隱、侵權等風險,與奧特曼交換意見;日本政府在衡量優點和風險后,將會評估引入OpenAI技術的可能性。
另一方面,奧特曼認為,未來推動AI科技進步需要有新的思路,不能只靠擴大AI模型和提供更多訓練數據的單一做法。OpenAI在GPT-4技術論文中指出,擴大模型規模的投資回報正在遞減,這是因為可以建設的數據中心數目、以及興建這些中心的速度,均存在物理限制。
未來AI模型規模重要性或下降
在麻省理工學院的一場活動上,奧特曼被問到GPT-4的訓練成本是否要1億美元,他的答案是“不止如此?!睌U大模型規模,輸入更多訓練數據,采用更大運算力,可說是OpenAI過去幾年推動GPT模型演進的基本套路。不過,或許OpenAI也深感模型規模不能無止境擴大,不宜繼續將之視為改進AI的唯一重要因素,所以宣布推出GPT-4時,未有如往昔般披露AI模型規模有多大。
如不再依賴擴大模型規模來提高性能,那么還有什么其他辦法可以增強AI能力呢?除研發新的AI模型設計或架構外,還可以使用“人類反饋強化學習”(Reinforcement Learning from Human Feedback)技術,透過人類的反饋來改進模型性能。
舉例來說,假設有一個機器人正在學習如何在一個迷宮中尋找出口。當機器人走錯路時,人類給予負面回饋;當機器人找到出口時,人類則給予正面反饋。通過這些反饋,機器人就可以學習如何更好地執行任務。
OpenAI技術上仍居領先位置
事實上,一家公司要在這場AI技術競賽中取得成功,有4項客觀條件非常重要:第一是運算能力,這需要巨額資金來采購大量GPU,以往只有大企業才能夠負擔,但隨著像Bedrock般的平臺式云端服務出現后,卻讓投資門檻大幅降低。第二是人才,就像馬斯克要啟動新AI項目,也要從DeepMind挖角AI人才。
第三是訓練數據,這涉及如何在有效率、不侵權的情況下,取得訓練模型所需的大量數據;馬斯克揚言要控告微軟,理由是對方違法使用Twitter數據來訓練其AI模型。第四是用戶回饋,讓AI模型可基于這些反饋來不斷調整和改進,而ChatGPT現有逾1億用戶正在使用,在這點上已握有絕對領先優勢。
由是觀之,生成式AI市場將會邁向群雄并起的戰國時代,除微軟、Google、亞馬遜等既有科技巨頭外,后起之秀還有X.AI、Anthropic、AI21 Labs、Cohere和Character.AI等。然而,OpenAI現時手握GPT-4模型,預計2023年9月或10月更會釋出GPT-4.5,在技術上依然是一騎絕塵,其他對手唯有投入更多資源來建構更強大的算法,以努力追上OpenAI的腳步。
《經濟通》所刊的署名及/或不署名文章,相關內容屬作者個人意見,并不代表《經濟通》立場,《經濟通》所扮演的角色是提供一個自由言論平臺。
(點擊用戶名可以查看該用戶所有評論) ![]() ![]() |