來源:融中財經 近日,大數據巨頭公司Databricks宣布億13億美元的價格(約合94億人民幣)收購生成式AI初創公司MosaicML。該筆發生在美國硅谷的收購案,為年內生成式AI領域內公布的最大一筆。引來業界高度關注。 MosaicML于2021年成立于美國舊金山,其剛成立不久便成功完成了第一輪融資,知名風投DCVC、Lux Capital、Future Ventures等投資機構參與,MosaicML共獲得3700萬美元的融資。 第一輪融資時,MosaicML公司估值為2.2億美元,但在此次收購中,MosaicML的估值直接提高近6倍,令業界感到驚嘆。 成立不到兩年,估值便如此之高,這家生成式AI初創公司到底有何“看家本領”? 01 AI模型服務企業端 產品質優價廉 根據公開資料顯示,MosaicML的產品組合包括開源的、商業授權的MPT Foundation系列模型和MosaicML 推理和訓練服務。 其推出的MosaicML Composer開源的深度學習庫,提供20種用于計算機視覺和自然語言處理的方法,包括模型、數據集和基準。推出的MosaicML Explorer可以幫助開發人員探索和理解不同的云服務和硬件選項之間的時間、性能和成本,以簡化和評估實施選項。推出的MosaicML AI開發平臺,提供了成本效益高的模型部署和定制訓練,同時保證數據安全,使用戶能夠擁有模型的所有權等。 值得一體的是,MPT基礎模型系列是MosaicML 提供的一系列開源、商業可用的大型語言模型,它們可以作為用戶構建自己的生成式AI應用的基礎。 MosaicML 的MPT基礎模型系列包括MPT-7B 和MPT-30B 兩個模型,分別有70億和300億個參數。 MPT-7B是MosaicML在今年5月5日發布的類ChatGPT開源大語言模型。MPT-7B 在MosaicML平臺上進行了9.5天的訓練,零人工干預,成本僅用了20萬美元。該模型具備可商業化、高性能、資源消耗低、1T訓練數據、可生成代碼等技術優勢。 AI2、Generally Intelligence、Hippocratic AI、Replit 和 Scatter Labs等知名廠商皆使用MPT-7B開發各種生成式AI產品。 截至目前,MPT-7B開源項目的下載量超過300萬次。收購方Databricks表示,這也是其收購MosaicML的重要原因之一。 另一款模型MPT-30B推出之后,同樣引來業界關注,十分受歡迎。其訓練成本遠低于其他競爭對手,有望推動AI模型在更廣泛領域的應用并逐步降低訓練成本。 MosaicML首席執行官兼聯合創始人Naveen Rao表示,MPT-30B的訓練成本僅為70萬美元,遠遠低于類似產品如GPT-3所需的數千萬美元訓練成本。該模型由于成本低、體積小,可以更快速地進行訓練,并且更適合在本地硬件上部署。 MosaicML還介紹稱,公司用 2 個月的時間訓練了 MPT-30B,通過數據混合進行預訓練,從 10 個不同的開源文本語料庫中收集了 1T 個預訓練數據 token,并使用 EleutherAI GPT-NeoX-20B 分詞器對文本進行分詞,并根據上述比率進行采樣。 需要注意的是,開發者可以從Hugging Face下載并使用開源的MPT-30B基礎模型,還可以使用自己的數據在本地硬件上進行微調。 MosaicML同時表示,將模型參數擴展到300億只是第一步,隨后他們將以降低更低成本推出更大體積、更高質量的模型。 MosaicML另一個比較有亮點的產品是今年推出的面向企業的MosaicML推理。 MosaicML首席執行官兼聯合創始人Naveen Rao表示:“一些初創公司已經在使用MosaicML的模型和工具來構建自然語言前端和搜索系統。MosaicML允許企業使用公司的模型架構根據自己的數據訓練模型,然后通過其推理API部署模型。如果客戶訓練了一個模型,他們可以放心,他們擁有該模型的所有迭代,該模型就是他們的。我們對此不擁有所有權。使用 MosaicML 的新推理產品,企業客戶可以部署用于文本完成和文本嵌入的 AI 模型,其成本比使用OpenAI的LLM低4倍,而圖像生成的成本比使用OpenAI的DALL-E 2便宜 15倍。” “我們希望讓盡可能多的人了解和使用這項技術,這就是我們的目標。這并不是排他性的。這不是精英主義。”Naveen Rao同時表示。 02 由英特爾前高管創立 MosaicML起點不低 作為初創公司的MosaicML,為何會連續推出爆款產品,這當然很其創始人有很大關系。 MosaicML是由曾在英特爾擔任AI產品負責人、Nervana Systems 的聯合創始人 Naveen Rao ,以及英特爾AI實驗室的高級主管Hanlin Tang創立。 MosaicML的創始人Naveen Rao ,1997年畢業于杜克大學的計算機科學專業,后取得布朗大學神經科學的博士學位。Naveen Rao長期致力于人工智能神經網絡的學習和開發,曾在高通擔任過神經形態機器的研究員,并在2014年創立了人工智能公司Nervana Systems。后來這家公司在2016年以4.08億美元被英特爾收購。 Hanlin Tang畢業于哈佛大學,研究人類視覺中的遞歸神經網絡。他在普林斯頓大學取得物理學學士學位,隨后在哈佛大學取得生物物理學的博士學位,研究人類視覺中的遞歸神經網絡,Hanlin Tang少年時代在臺北度過。后來加入英特爾后,在英特爾AI實驗室擔任高級主管,在此期間Hanlin Tang負責算法工程和深度學習研究,并參與了MLPerf基準測試的開發。 Hanlin Tang在國際頂級期刊和會議上發表了多篇論文,涉及計算神經科學、計算機視覺、自然語言處理和強化學習等領域。 還有一位值得一提的團隊成員是MosaicML的首席科學家Jonathan Frankle,他是MIT計算機科學與人工智能實驗室的博士后研究員,也是哈佛Kempner研究所的附屬教員。Jonathan Frankle的研究方向是神經網絡的學習動力學和訓練算法,旨在提高大型語言模型(LLM)的效率同時降低訓練成本。這一研究方向也正是MosaicML的核心競爭力所在,可以說Jonathan Frankle是MosaicML能賣到94億的關鍵人物。 Naveen Rao和Hanlin Tang之所以能在英特爾任職,是因為Nervana Systems開發了Neon 這一高性能的深度學習框架,以及后來推出的Nervana Cloud深度學云平臺、Nervana Engine專用硬件加速器,英特爾認為這些產品非常有價值,就把Nervana Systems收購了。Naveen Rao和Hanlin Tang也一起加入英特爾,一位成為了AI產品集團的負責人,一位成為了AI實驗室高級主管。 不過,2020年英特爾宣布放棄原計劃的Nervana服務器端AI加速芯片,去耗資20億美元收購以色列公司Habana的產品。 在英特爾決定“拋棄” Nervana后,Naveen Rao和Nervana的前核心員工Hanlin Tang也一起離開了英特爾,兩人另立門戶創立了今天的MosaicML。根據LinkedIn的信息,目前Hanlin Tang擔任MosaicML的CTO。 03 Databricks收購MosaicML 強強聯合? Databricks收購MosaicML不僅僅是因為商業價值,更是為了兩個公司可以強強聯合,實現技術上的突破,加碼AI大模型。 先來看看收購方Databricks,這是一家數據存儲和分析領域的巨頭公司,由美國加州大學伯克利 AMP 實驗室的 Spark 大數據處理系統多位創始人聯合創立。Databricks 的客戶遍及大中小企業,以及各個行業。截至 2023 年 03 月,其全球已有超過 9000 家企業用戶。包括 AT&T、殼牌、巴寶莉、豐田、Walgreens、Adobe、康泰納仕和再生元制藥等。 2021 年,Databricks拿下了摩根士丹利旗下Counterpoint Global領投的16億美元H輪融資。2023年4月18日,Databricks以298億美元億的估值入選《2023·胡潤全球獨角獸榜》,名列第七。 業內專家表示,收購完成之后,MosaicML 將成為 Databricks Lakehouse 平臺的一部分,MosaicML 的整個團隊和技術都將納入 Databricks 旗下,為公司提供統一的平臺來管理數據資產,助力 Databricks更好的開發生成式AI技術。同時能夠使用自己的專有數據來構建、擁有和保護自己的生成式 AI 模型。 DataBricks 的 CEO Ali Ghodsi 也表示,收購 MosaicML 將進一步增強 DataBricks 的數據分析平臺。 DataBricks收購MosaicML是為加碼AI大模型是主流觀點,原因是MosaicML因其尖端的MPT大語言模型而受到認可,MPT-7B和MPT-30B都是今年開發的爆款產品,下載量均突破百萬。 值得一提的是,MosaicML的模型訓練自動優化使得訓練速度比標準方法快2-7倍,而資源的近線性擴展允許在幾小時內訓練多十億參數的模型。 借助于雙方的聯合產品,Databricks和MosaicML的目標是將訓練和使用LLMs的成本從數百萬美元降低到數千美元。 由此可見,Databricks正試圖加碼AI大模型,去挑戰OpenAI、微軟、谷歌等大公司的市場地位,為行業帶來新的選擇。 但也有反對觀點認為Databricks 整合 LLM 的價值主張是不太明確,因為Databricks主營Lakehouse,主要是用Spark來處理大規模集群數據,因此其整合大語言的價值并不明確。還有業內人士認為,Databricks 是在借當前大模型熱度進行炒作,收購對技術方面不會有明顯的突破,MosaicML 遲早會被Databricks放棄。 這起收購案能否能獲得良好的效果,在實現商業價值的同時,也能有技術突破,可能仍需要等待時間去驗證。 財經方面專家認為,收購MosaicML的交易可能是這家AI獨角獸公司為IPO之路打下基礎。 04 AI大模型并購潮拉開大幕 去年末ChatGPT的橫空出世,拉開了AI競賽的大幕,半年之后,又出現了AI并購潮。 原因無外乎是生成式AI經過一段時間的野蠻生長,然后大型企業取得一定的進展,同時也發現了現有技術和人才的不足,而那些AI初創公司,相對來說要專業一些,既有人才也有技術,但存在資金不足、資源稀缺等問題。所以AI并購潮現在出現是必然的,對于整個行業來講也是正向的、有利的。 除了本文介紹的Databricks收購MosaicML之外,今年5月,云計算巨頭Snowflake宣布收購了由兩位前Google員工創立的生成式AI搜索初創公司Neeva。業內專家認為,此次收購將使Snowflake能夠利用尖端的搜索技術,并將其注入到數據云中,充分客戶、合作伙伴和開發者的需求。 值得一提的是,Neeva的領導團隊成員在創建YouTube貨幣化和Google的搜索廣告等產品時,起到了非常重要的作用。不出意外的話,此次收購將把Snowflake中的搜索和對話提升到一個新水平。不過此次收購的金額并沒有對外公布。 6月26日,全球最大的專業信息服務提供商湯森路透宣布,以6.5億美元現金收購AI初創公司Casetext,該公司主營業務是為法律人士提供AI助理服務。 公開資料顯示,Casetext員工數為104名,客戶包括1萬多家律師事務所和企業法務部門。其主要產品CoCounsel是一款于今年推出的人工智能法律助理,由GPT-4提供支持。該筆收購將有效補充湯森路透現有的AI路線圖。 6月29日,AI初創公司Inflection宣布完成13億美元融資,該輪融資由微軟、英偉達等牽頭投資,其融資總額達到15.25億美元。 再看中國的AI市場,6月29日,美團發布公告,宣布已完成光年之外境內外主體100% 的股權收購,耗資20.65億人民幣。 對于此次并購,美團在公告表示,光年之外是中國領先的AGI創新者,其目前的管理與技術團隊具有開發深度學習框架的高水平經驗。公司通過收購事項可以獲得領先的AGI技術及人才,有機會加強其于快速增長的人工智能行業中的競爭力。 美團方面表示,并購完成后,將支持光年團隊繼續在AI大模型領域進行研究和探索。 無獨有偶,今年6月16日,昆侖萬維發布公告稱,旗下控股子公司Star Group擬發股收購Singularity AI全部股權。 Singularity AI致力于實現通用人工智能,目前聚焦于自然語言大型預訓練模型及開發者API的研發工作,主要產品及服務包括通用開發者API、聊天機器人和知識抽取。 國外出現AI并購潮,釋放出了一個強烈的行業信號,意味著國外AIGC的發展已經開始升級,無論是技術、業務、場景還是商業化,都隨時可能出現顛覆性的創新。 對于國內AI市場,投資人持謹慎樂觀態度。總的來說是B端應用面臨企業端數字化緩慢,軟件付費意愿不強,商業化緩慢等問題,對比國外AI市場依然差距不小。 不過我們也要看到,中國是美國市場之外唯一一個擁有完整的AIGC產業鏈的國家,在這場第四次工業革命之中,大家都沒有退路。 |