免費谘詢熱(rè)線

13621929115
常見問(wèn)題(tí)
您(nín)的位置: 主頁 > 新聞動態 > 常見問題

生產線模型

發(fā)布日期:2023-04-04 21:41瀏覽次(cì)數:

ChatGPT在全球掀起AI大模型的浪潮(cháo)在美國,以OpenAI、Anthropic等初創企業和以微軟、Google為代(dài)表的科技巨頭帶領著美國在AI大(dà)模型的道路上蒙眼狂奔,最大參數已(yǐ)卷到5620億(yì)在中國,美團王慧文、阿裏賈揚清、前搜狗(gǒu)CEO王小川、前京東AI掌門人周伯文等眾多早已功成名就的科技大佬(lǎo)再次生產線模(mó)型披掛。

    AI大模型一時(shí)間如烈火烹油但在這一輪(lún)浪潮(cháo)中, 大家主要關注的還(hái)是中美兩國的進展在(zài)此之外,世界其他(tā)國(guó)家和地區如何(hé)看待AI大模型,在發(fā)展大(dà)模型上又進展如何,不同國家和地區的AI大模型(xíng)發展呈現出哪些特(tè)點?這些問題在中美的光環下其實是失焦的(de)。

    所謂他山之石可以攻玉,在(zài)這樣的背景下,自象限梳理(lǐ)了包括中國、生產線模型美國、韓國、日(rì)本和歐洲等主要國家(jiā)AI大模型的發展(zhǎn)現狀www.17C.com發現,一方麵,不同國家AI大模型的發展與所在國的互聯網發展息息相關;另一方麵,包括芯片、雲計算、高質量數據等產業基礎,模型構架和算法經驗,以及用戶群(qún)體、社會文(wén)化又共同決定(dìng)了所在國家(jiā)AI大模型的發展高度。

    就如同比爾·蓋茨(cí)將ChatGPT的發布比作生產線模型互聯網的發明,並認為(wéi)它可(kě)以改變世界一(yī)樣,英偉達CEO黃仁勳也在GTC2023上三次提(tí)到“AI迎來iphoness時刻”AI大模型是全世界的機會,而中國創業者更不應該(gāi)存在視野盲區。

    將視野拉遠便會發現,各國大模型都繼承了本國(guó)“基因”,前(qián)二十年互聯網與科技積累的成果,也都在AI 2.0的大考下,瞬間爆發有人交生(shēng)產線模型了(le)滿分答卷,也有人名落孫山美國:有多強悍,就有多寂寞美國在AI大模型方麵的強,不是現在強,。

    而是一直以來都很強從2012年AI萌芽時期,到2016年AI1.0時期,再到2022年ChatGPT帶來的AI2.0時期,美國一直是AI領域的破局者,引領著全世界AI發展再進一步比如現在幾乎所有AI大(dà)模型訓(xùn)練生產線模型時采用的Transformer網(wǎng)絡結構,是穀歌在2017年提出(chū)的,它具(jù)有優(yōu)秀的長序列處理(lǐ)能力,更高的並行計(jì)算效率,無需手動設計以及更強的語義表達能力等特征。

    Transformer的提出讓大模型訓練成為可能算力是保(bǎo)證AI大模型出現在美國的(de)另一個關鍵,而美國一手雲大廠,一手英偉達,手(shǒu)握著全球(qiú)算力的核心資生產線模型源雲計算能夠為AI大模型訓練提供計算、存儲、網絡和應用(yòng)平台,同時也提供(gòng)數據處理、模型部署、推理等AI工具和服務。

    讓企業能夠快速訓練大模型,而不用再花費你大量時間和金錢去建立和維(wéi)護自己的(de)數據中(zhōng)心目前,美(měi)國擁有世界上最大的雲計算企業IDC數據顯示,2021年全球IaaS市場中,包(bāo)括亞馬遜、微軟、穀(gǔ)歌、I生產線模(mó)型BM在(zài)內的美國企業合計占比近70%。

    而美國最具代表性的AI大模(mó)型(xíng)初創企業,無論是OpenAI還是Anthropic都接受了微軟和穀歌這樣的雲(yún)大(dà)廠投資這背後除了資金支持外,更重要的原因(yīn)還在於背後的雲計算資源

    打開鳳(fèng)凰新聞(wén),查看更多(duō)高清圖片算力的另一個維度是芯片,高性能的(de)芯片可以提供更加高效的(de)計算能力(lì),從生產線模型而加速訓練過程速度有多(duō)快呢(ne)?2016年,黃仁勳親手將世界第一台DGX-1(英偉達計算平台)捐獻給(gěi)了OpenAI,DGX-1是(shì)3000人花費3年時間才研發出來的首個輕量化的小(xiǎo)型超算,計算和吞(tūn)吐能力相當於 250台傳統服務(wù)器(qì)。

    有了DGX-1,OpenAI之前一年的計算量隻要一個月就能完成而目前為止,英偉生產線模型達的A100芯片仍然是唯一能(néng)夠在雲端實際執行任務的GPU芯(xīn)片最近的(de)GTC2023上,黃仁(rén)勳又更新了新芯片H100的進度H100配(pèi)有Transformer引擎,可以專門用作處理類似ChatGPT的AI大模型,由其構建的服務器效率是A100的十(shí)倍。

    可以說,在AI大模型領域,目前的美(měi)國就是妥妥的“別(bié)人家孩生產線模型子”,這也導致目(mù)前行業最具代表(biǎo)性的AI大模型都集中在美國比如OpenAI最新發布的多(duō)模態預訓(xùn)練大模型(xíng)GPT-4,穀歌最新推出“通(tōng)才”大模型PaLM-E,擁有世界最大規模的5620億參數,能看圖說(shuō)話、能操控(kòng)機器人,以及(jí)剛剛解決AI繪畫手指問題的Midjourney等等。

    但在快速發展的過程(chéng)中(zhōng),美國業界對(duì)生產線模(mó)型於AI大模(mó)型也持激進和保守兩種不同的態度其中,微軟支持的(de)OpenAI在推動(dòng)大模型(xíng)落地時(shí)就更(gèng)加激進根據OpenAI關於GPT-4的安全文檔,OpenAI曾在發布GPT-4前(qián)聘請(qǐng)安全專家(jiā)進行測試。

    OpenAI在文檔中寫道:“GPT-4表(biǎo)現出(chū)一些特別令(lìng)人擔憂的能力,例如製定和實施長(zhǎng)期計劃(huá)的能力,積累權(quán)力和生產(chǎn)線模型資源(yuán)(尋求權力),以及表現出越來越‘代(dài)理’的(de)行(háng)為”因此有安全(quán)專家建議將 GPT-4 的部署(shǔ)時間推遲 6 個月,到今年秋季再發布,但OpenAI並沒有采納這份(fèn)建議。

    而另(lìng)一方麵(miàn),在ChatGPT發布之(zhī)後,穀歌曾表示自己已經具備相似能力的AI大模型,但基於(yú)安全考慮並沒有及時推向市場包括OpenAI創(chuàng)始人S生產線模型am Altman和馬斯克都(dōu)曾多次在公開場合表達了對(duì)AI大模型和人工智能(néng)的擔憂,表示應該(gāi)更謹慎地對待大(dà)模型的市(shì)場化。

    目前由穀歌投資(zī)的,能夠對標OpenAI的另(lìng)一家AI初(chū)創公司Anthropic其實就是因為這樣的理念(niàn)不同,而從OpenAI出走並自立門戶的當然,在激烈的市場競爭下,即使曾經相對謹慎的穀(gǔ)歌生產線模型(xíng)也(yě)似乎(hū)忘記了這條擔憂,。

    並在3月7日報複性砸出5620億參數大模型,甚至能夠控製機器人運動目(mù)前,以微軟和OpenAI為代表(biǎo),美國AI大模(mó)型正在積極推動(dòng)產業應用微軟早(zǎo)在2月份就宣布將會在全線產品接入ChatGPT,並以幾乎一周一個產品的速度向外(wài)更新。

    從New Bing到加入最(zuì)新功(gōng)能Copilot的Mi生產線模型(xíng)crosoft Teams正(zhèng)在(zài)攪動全(quán)球的產業變革日本:錯過互聯網,錯過雲,錯過AI如果說美(měi)國是最(zuì)厲害的大模型“老炮”,那日本可能就要淪為(wéi)這(zhè)次排名的“吊車尾”。

    日本的落後其(qí)實要從上個互聯網(wǎng)時代講起www.17C.com盤點世界AI大模型領域(yù)的關鍵角色會發現,無論(lùn)是中國的BAT,韓國的(de)Naver,還是美國的(de)穀歌、亞馬遜,生產線模型他們都(dōu)是互聯網(wǎng)時代的(de)巨(jù)頭(tóu)一方麵(miàn),這些企業通過互聯網業務積累了大量的高質量數據;另一方(fāng)麵(miàn),他們在(zài)自身業務(wù)推動下建立了完整的雲(yún)計算體係。

    但盤點(diǎn)之後www.17C.com(men)發(fā)現,整個日本既沒有叫(jiào)得出名字的(de)互聯網巨頭,也沒有拿得出手的雲計算廠商目前,日本的即時通訊軟件來自韓國的LINE,雲計算(suàn)業務也被美國企業長期把持2022年生產線模型,日(rì)本雲計算市(shì)場份額約占全球的4%,排名第四。

    但(dàn)日本雲計算市場的主要競爭者卻是(shì)美國的三大雲巨頭亞馬遜、微軟和穀歌,它們在日本的市場占有(yǒu)率已經達到60%~70%除此之外,日(rì)本其實還麵臨許(xǔ)多其(qí)他問題,比如由於半(bàn)導(dǎo)體產業的衰落,讓日本(běn)在本應成為最大優勢的AI芯片領域缺位;比如作為一個小語種國家,日語麵臨和生產線(xiàn)模型中文一樣缺乏語料的問題(tí)。

    在這樣的背景下,日本在AI時(shí)代其實早就喪失(shī)了自主權所以www.17C.com盤點日(rì)本的AI大模型,會發現它們大多具有美(měi)國或者韓國色彩比如日本(běn)最早公開上線的NLP大模型是2020年(nián)發布的NTELLILINK Back Office NLP,當時它能(néng)實現如文檔分類、知識閱讀(dú)理解、自動總結等功能。

    但生產(chǎn)線模型NTELLILINK Back Office是在穀歌BERT基礎上開發(fā)的應用,就像中國許多(duō)基於GPT-3開發(fā)的應用一(yī)樣更有日本血統的生成式AI其實是HyperCLOVA、Rinna 和 ELYZA Pencil,但其中HyperCLOVA 和 Rinna 也都有外國(guó)基因。

    其中(zhōng),HyperCLOVA最生產線模型早是韓國搜索巨頭(tóu)NAVER在2021年推出(chū)的,其日本版是由NAVER和其子公司LINE(韓國軟件在日本經營)一起研發但HyperCLOVA確實是第一個專門針對日語的大語言模型(xíng),。

    其通過爬(pá)取日本的博客服務(wù)來(lái)獲取訓練(liàn)數據,並在(zài)2021年舉行(háng)的對話係統現(xiàn)場比賽中獲得了所有賽道(dào)的第一名基於HyperCLOV生產線(xiàn)模型(xíng)A,LINE也推出許多應用,比如聊天機器人CLOVA Chatbot、圖像識別CLOVA OCR和科洛(luò)瓦演講CLOVA Speech等等。

    HyperCLOVA擁有820億參數,目前正計劃通過超100億頁的日文數據作為學習數據將模型規模擴大到1750億

    日本版(bǎn)HyperCLOVA官網日本的另一個AI大模生產(chǎn)線(xiàn)模型型Rinna則與微軟有關,Rinna最早是微(wēi)軟日本研發的一款聊天機器人,類似於國內的小冰(之前叫微(wēi)軟小冰,目前已獨立運營)2021年8月,Rinna發布了一個名為GPT2-medium的模型,然後又在次年推出了日本版的GPT-2,參數達(dá)到13億。

    日語版GPT-2與GPT-2的(de)區別在於,GPT-2采(cǎi)用生產線模型的是英文語料,而日語版GPT-2是基於日語語料訓練目前,Rinna的日語(yǔ)版(bǎn)GPT-2和HyperCLOVA已經是日本參(cān)數規模最大、最具代(dài)表性的大(dà)模型了。

    當然,日本也有一些真正土生土長(zhǎng)的(de)大模型,比如2022年3月,由東京大學(xué)鬆尾研究所(suǒ)的AI初創公司 ELYZA Co., Ltd.推出(chū)大語言模型,它以產生(shēng)產線模型品“ELYZA Pencil”的方式(shì)推向市場輸入幾個關鍵字,。

    ELYZA Pencil可以在大約6秒內(nèi)創建三種類型的日語新聞報道、電子郵件或簡曆所以算起來,ELYZA Pencil才算(suàn)真正意義(yì)上(shàng)日本首次公(gōng)開發布的(de)生成式AI產品(pǐn),但僅有ELYZA Pencil顯然很(hěn)難成為全村的希望(wàng)。

    日本政府其實也在想生產(chǎn)線模型辦法扭轉這種局麵,比如2022年5月,日本政(zhèng)府計劃將雲計算服務列為涉及國家安(ān)全的“特定重要物資”,並將(jiāng)加強日本本國的“國產雲”,但執行下(xià)來其實收效甚微畢竟無(wú)論是互聯網還是雲計算都是規模經濟,。

    需要有足夠的市場容量才能產(chǎn)生經濟效益這也導致日本互(hù)聯網和雲計算無論是在全球市場,還是在本土市場都缺(quē)乏充(chōng)足的成生產線模型長空間但即便如此,日(rì)本市場也在積極做著大模型的應用的研究比如(rú)2022年5月,東京大學和 Google Brain 的一個(gè)研究團隊發布了論文《Large Language Models are Zero-Shot Reasoners》,解決(jué)了大模型0樣本學習的部分(fèn)問題。

    而在日本的互聯網(wǎng)上(shàng),日本網友也在生產線模型積極調(diào)用GPT-3的API,嚐試開發自己的獨特應用此外,在剛剛舉行的英偉達GTC 2023上,英偉達與日本三菱聯(lián)合打造了日本第一台用於加(jiā)速藥研的生成式AI超級計算機韓國:隻有財閥巨頭,沒有初創公司

    沒(méi)想(xiǎng)到的是,一直被日本看不上的韓(hán)國,在大模型領域反而比日本跑得更快些事(shì)實上,韓國是最早加入AI大模型(xíng)研發生產線模型的國家之一(yī),但韓國的(de)AI大模型(xíng)這個國家的經濟一樣,隻有財閥的身影,沒有初創(chuàng)公司的故事目前,韓國在大模型領域的代表隻有互(hù)聯網巨頭Naver和Kakao,移動運營商巨頭KT和SKT,以及通信巨頭LG。

    除了財閥唱主角之外,緊跟美國步伐也是他們的一個重要特點比如在GPT-3的應(yīng)用上,2020年OpenAI發生產線模型布GPT-3的論文,韓國企(qǐ)業(yè)在2021年就推出了相應產品,反應速度比中(zhōng)國更(gèng)快這(zhè)種緊跟在AI方麵也是如此,2020年(nián)穀歌、亞(yà)馬遜等美國巨頭開始推出AI加速芯片時,SKT就(jiù)同(tóng)步推出了(le)自主研發的AI加速芯片SAPEON X220。

    韓國(guó)在芯片半導體方麵的積累(lèi)也放大了它在(zài)AI大模型(xíng)方麵的優勢目(mù)前韓國企業正在和生(shēng)產線模型半導體企業積極結盟(méng),以應(yīng)對大模型發展帶(dài)來的算力挑戰比(bǐ)如2022年底,Naver就開始和三星(xīng)電子合作開發下一代人工智能芯片解決方(fāng)案,該解決方案基於Naver推出的AI大模型Hyperclova進行(háng)優化,目前開發已進入最後階段。

    同年,KT公司也對芯片設計(jì)公司Rebellions Inc.進行了戰略投資,生產線模型(xíng)這是一家位於韓國本土的AI初創(chuàng)公司(sī),在芯片方麵擁有獨(dú)特的(de)技術Rebellions將為KT公司優(yōu)化MI:DEUM,並推動其(qí)商業化。

    除此之外,KT公司還(hái)投資了AI初創公司Moreh,並計(jì)劃在今年推出一套韓國的半導體,其效率可(kě)能是現在半導體(tǐ)的三倍以上KT希望通過這種方式,全麵進入(rù)目前由(yóu)英偉達主(zhǔ)導的AI半導生產線模型體市場第三點,則是韓國在(zài)AI大模型的垂(chuí)類應用已經有(yǒu)比較多的探索。

    比如(rú)KoGPT在醫(yī)療保健方麵(miàn)的應用,Exaone在生物醫藥和智能製造(zào)方麵的應用等等整體上看,韓國的AI大模(mó)型在基礎設施方麵(miàn)非常完善,比如在算力方麵有三星(xīng)電子,SKT等半導體巨頭;互聯網方(fāng)麵有Naver和Kakao這樣的標杆企業,這些特(tè)點生產線模型都讓韓國(guó)能在AI大模型的發展浪潮中(zhōng)走(zǒu)在世界前列,並推出(chū)了一係列具有代表性的AI大模型。

    比如前麵提(tí)到,韓國(guó)最大的搜索公司Naver在2021年(nián)推出了HyperCLOVA,韓國版的 HyperCLOVA 擁有2040億參數,比GPT-3還要多290億(yì),且其中97%使用的是韓文語料目前,Naver已計劃在(zài)生產線模型今年上半年基於HyperCLOVA推出Search GPT(類似微軟New Bing)並在7月份推出HyperCLOVA X,這是HyperCLOVA的最新版本。

    韓國版HyperCLOVA架(jià)構同樣是在2021年,韓國另一家互聯網巨頭Kakao 旗下的AI研究部門Kakao Brain發布了一個基於G生產線模型PT-3的KoGPT,之後Kakao Brain又將KoGPT更(gèng)新至GPT-3.5,實現與 ChatGPT使用相同版本的預訓練大模型。

    Kakao Brain首席技術官Kim Kwang-seob表示:“KoGPT將專注於開發基於(yú)AI的(de)圖像創建技(jì)術和醫療保健技術”Kakao Brain在KoGPT之外生產(chǎn)線模型還推出了基於人工智能的(de)圖像生成 Karlo、BEDIT和BDiscover,類似於stable diffusion。

    2022年5月,SKT推出了基於(yú)GPT-3的(de)聊天機器人A.的測試版,用來處(chù)理客戶的(de)特定任務目(mù)前,A.在韓國已經獲得(dé)了100萬用戶,並計劃在今年推出正式版2022年12月,LG集團的人工生(shēng)產(chǎn)線模型智能智(zhì)庫LG AI Research推出了Exaone。

    這是一個擁有3000億(yì)參(cān)數,使用圖像和文本數據的多模(mó)態(tài)模型,也是目(mù)前韓國參數規模最大(dà)的模(mó)型(xíng)Exaone應(yīng)用在生物醫藥(yào)和智能製造方麵,有助於加速抗癌疫苗和創新電(diàn)池的開發。

    Exaone在電池(chí)產業(yè)和生物醫(yī)藥的應用(yòng)到今年1月,據韓國經濟日報報道,韓國K生產線模型T公司也將在上半年推出自己(jǐ)的類ChatGPT產品此前,KT公司在2022年(nián)11月推出了基於GPT-3的人工智能服務MI:DEUM,它能夠實時回(huí)答(dá)問題、總結報紙文(wén)章(zhāng),並給出投資(zī)建議。

    KT公(gōng)司目前也正在(zài)積極向韓國的金融服務公司推廣MI:DEUM但(dàn)韓國同時也麵臨許多挑戰,比如韓文(wén)在(zài)語料方麵和中文、日語一樣(yàng)生產線模型,麵臨複雜的(de)語言體係和語料不足的問題HyperCLOVA的工程師提到:“韓(hán)語是一種凝集性語言(yán),名詞(cí)後麵有例子,動(dòng)詞和形容詞的(de)詞幹後麵有尾音,並有各種語(yǔ)法性質的(de)表達。

    對韓語使(shǐ)用類似英語的標記化已被證(zhèng)明會降低韓語語言模型的性能”除此之外,韓國產業界(jiè)認(rèn)為,韓國嚴格的數據使用規定(dìng)阻礙了韓國初創(chuàng)企業(yè)收(shōu)集足夠大生產線(xiàn)模型的數(shù)據來訓練AI大模型韓國是(shì)目前世界(jiè)上數據信息管(guǎn)理最嚴格的國家之(zhī)一。

    雖(suī)然在2020年韓國通過了三大數據隱私法的修訂法案,以放寬對個人信息使用的規定,但該國對數(shù)據使(shǐ)用的規定(dìng)仍然比其(qí)他國家更嚴格2021年初,韓國AI初創公司Scatter Lab上線了一款基於Facebook Messenger的AI聊生產線模型天機器人“李LUDA”,但僅僅過了20天,“李LUDA”就不得不(bú)終止服務,Scatter Lab甚至為此公開道(dào)歉。

    原因在於,“李(lǐ)LUDA”上線之後,一些韓國(guó)男性(xìng)用戶將其視作性對象甚(shèn)至“性奴隸”,肆意發泄自身的惡意他們對“李LUDA”進行各種言語上的侮辱,並以此作為炫耀的資(zī)本,在網上掀起“如何讓LUD生產線模型A墮(duò)落”的低(dī)俗討論。

    受這些信息影響(xiǎng),“李LUDA”很快開始發表各種歧視性言論,涉及女性、同性戀、殘障人士及不同種族人群“李LUDA”的問題也牽涉出韓國的個人信息保護問題,並有相關部門介入調查“李LUDA”的案例就像總能直擊人心的韓國電影一樣,為世(shì)界AI大模型的發(fā)展提供了更多關於倫理、道德等方麵的啟示生(shēng)產線模型。

    許多(duō)人害怕AI的惡意,但AI其實本沒有善惡之分,所謂的善(shàn)惡其實都來自(zì)於人類自己,這取決於你給AI什麽樣數據,就像我(wǒ)們教育孩子什麽樣的知識一樣除此之外(wài),韓國AI大模(mó)型領域(yù)缺少初創公司的身影(yǐng),且韓國對初創公司的投資也比較匱乏。

    根據斯坦福大學HAI發布的 AI Index 2022,韓國初創企業獲得投(tóu)資生產線模型額為11億美元,僅(jǐn)占美國初創(chuàng)企業獲得投資額529億美元的(de)2%,甚至低於(yú)以色列的24億美元這也導致韓國在AI初創公司獨角獸(shòu)方(fāng)麵落後於其他國家。

    根據全球(qiú)科技市(shì)場追蹤機構(gòu)CB Insights的數據,截至2022年(nián)12月,美(měi)國的(de)AI獨角獸數量最多,有(yǒu) 53 家初創公司中(zhōng)國以19家位居第(dì)二(èr),其次(cì)是英國有4家生產線(xiàn)模型,但韓國卻沒有AI獨角獸公司,而(ér)即使是國內生產總值(GDP)低於韓國的以色列也有 3 家。

    數據來源CB Insights一家專注於交互式AI技術的韓國機器學習技術的企業Genesis Lab Inc. 創始人兼CEO Lee Young-bok 表(biǎo)示,韓國公司總體上對人工智(zhì)能並不友(yǒu)好,並補充說政府(fǔ)或生(shēng)產(chǎn)線模型公(gōng)共組織(zhī)應該更加積極地采用人工智能技術。

    歐洲:隻有德國在認真“搞事業”一直以來,歐洲似乎是僅(jǐn)次於美(měi)國的存在,但在AI 大(dà)模型方麵,歐洲並不比(bǐ)日本更出色,甚至處於持(chí)續擺爛(làn)狀態Future of Life Institute(FLI)曾在2022年(nián)11月發(fā)表過一篇報告提到:。

    “歐洲沒有開(kāi)發通用人工智能係生產線模型統,也不(bú)太(tài)可能很快開始這樣做”FLI是美(měi)國的一(yī)家致力於減少人類麵臨的全球災難性和生存風險的非(fēi)營(yíng)利(lì)性機(jī)構,先進人工智能(néng)帶來的風險(xiǎn)是其最重要的研究方向之一,其創始人包括(kuò)DeepMind研究科(kē)學家Viktoriya Krakovna,馬斯克也在該機構擔(dān)任(rèn)顧問,並提供資助。

    FLI認為(wéi),在AI大模(mó)型方麵,歐洲生產線模型可能會主要扮演一個使用者的角色,即通過接入其他國家開發的大模型API來開發應用比如芬蘭的Flowrite,一個基於AI的寫作工具,可以將輸入關鍵詞生成郵件、消息等內容比如荷蘭的MessageBird,一個全渠道通(tōng)信平台,這兩者都是在GPT-3的基礎(chǔ)上運行的。

    歐洲在AI大模(mó)型方麵確(què)實缺少有影響力的企業生產線模型,唯(wéi)一一個總部位於英(yīng)國的(de)DeepMind還是由Alphabet全資擁有整個歐洲,唯一擔心因為大模(mó)型落後而被世界甩開,並為此操碎了心(xīn)的(de)隻有德國比如穀歌3月7日最新推(tuī)出的多模態大模型PaLM-E,就(jiù)由(yóu)穀歌和柏林工業大學共同打造,。

    目前PaLM-E擁有(yǒu)5620億參數,是全球最大的視覺語言模型除了合作研(yán)發之生產線模型外,德國還擁有歐洲目前唯一一款AI大模型(xíng)2022年4月,位於海德堡的德國初創公司Aleph Alpha發布了一款擁有700億(yì)參數的預訓練模型Luminous,大約是GPT-3的一半左右。

    Aleph Alpha在此基礎上訓練了聊天機器人Lumi,並計劃在今年(nián)晚些時候發(fā)布最新版Luminous-Worl生產線模型d,其參數規模將達到3000億作為歐洲企(qǐ)業(yè),Luminous最大的特點在於更保(bǎo)護(hù)安全和隱私,Aleph Alpha 表示他們“不記錄任何用戶數據”。

    而(ér)包括OpenAI在內的大多數AI大模型需要用戶數據進行訓練(數據收(shōu)集過程是透明的)

    Luminous官網除了建設大模型(xíng),德國也(yě)為歐洲薄弱的(de)人工智能基礎設生產線模型施操碎了心德國人工智能協會正在開展一項大型歐洲(zhōu)人工智能模型(LEAM)的計劃,並(bìng)得到博世、SAP、大陸、拜耳、默克等德國行業巨(jù)頭以及歐洲類似人工智(zhì)能協會的支持。

    LEAM計劃(huá)投資3.5億(yì)歐(ōu)元,從數據收集、人才培訓、基礎(chǔ)設施(shī)建設等方麵為歐洲AI大模型的發展建立一個有競(jìng)爭力的AI生態係統當(dāng)然,你可以吐槽歐生產線模型洲在技術和商業上的拉胯,但(dàn)不(bú)能吐槽它在公共事業上的努力歐洲還有一個名叫BLOOM的大模型,發布在2020年8月。

    這是一個由AI初創公司Hugging Face在(zài)法國政府的資助下發起的項(xiàng)目,全(quán)球1000多名誌(zhì)願者研究人員耗時一年(nián)多創建的AI模型(xíng),旨在消除傳統大(dà)語言模型的保密性和排他性,並(bìng)從(cóng)一開始就嵌入生產線模型倫理考量BLOOM有1760億(yì)參數,它被設計得盡可能透明(míng),並且是第一次采用(yòng)了西班牙語、阿拉伯語等語言(yán)訓練。

    BLOOM最大的特點在(zài)於可訪問性,任何人都可以從Hugging Face網(wǎng)站免費下載它進行研(yán)究BLOOM的(de)研究(jiū)人員認(rèn)為,開發一個任何人(rén)都可以使用,並且性(xìng)能與其他(tā)高級模型相當的大語言模型將帶(dài)來人(rén)工生(shēng)產線模型智能開發文化的長期變化。

    所以從歐洲的視角來(lái)看,這是一項致力於AI民主化的重要工作。

    從 BLOOM的視角可以看(kàn)出,歐洲在AI大模型上的關注重(chóng)點與世界其他國家是不一樣的(de),開源普(pǔ)惠、綠色安全這一類關於SDG的詞匯一直是歐洲關注的重點所以在AI大模型之後,歐洲大量精力(lì)其實(shí)都用在了立法上比如最重要的一項立法就生產線模型是即(jí)將在(zài)3月底提交歐盟議會表決的《人工智(zhì)能法案》。

    這項法案是歐盟委員會在2021年提出的,原因是歐盟認為從跨國視角來看,各國獨立的監(jiān)管措施會(huì)導致監管碎片化,進而妨礙跨境人工智能市場的形成,並威脅到數(shù)字主權同時他們也擔心複雜的監管會抑製創新(xīn)、威脅個人隱私、甚至AI一旦失(shī)控帶(dài)來(lái)的一些潛在風險。

    當然,最重生產線模型要的是,歐盟希望通過立法的方式參與到全球人(rén)工智能的標準製定當中具體而言,歐盟(méng)希望將不(bú)同的AI技術根據風險水平進行分類,具體為:最小、有限、高以(yǐ)及不(bú)可(kě)接受高風險技術不(bú)會被禁止,但(dàn)相關公司將被要求在運營中保持高度透明。

    而所謂透明,其中(zhōng)的規則就是迫使相(xiàng)應的公司闡明其人工智能模型的內部運作方式(shì)而這項法案一旦生產線模型通過,意味著將成為(wéi)歐盟成員國內直接適用的法律,之後如果企業想在歐盟銷售或使用人工智能產品就必須遵守相應的法規,否則將麵臨高達(dá)其全球年營業額6%的罰款。

    但FLI認為,歐(ōu)洲對其他國家的技術依(yī)賴可能阻礙(ài)歐盟參與製定人工智能全球標準的努力(lì)歐洲的問題在於,缺乏一(yī)個統一的大市場在GDP總(zǒng)量上(shàng),歐盟2022年GD生產線(xiàn)模型P16.65萬億美元與中國相當;在人口數量上,歐盟2022年人口4.46億,甚至超過美國3.32億。

    但歐盟卻擁有28個國(guó)家,23種官方語(yǔ)言,再加上與美國(guó)的深度綁定,都導致歐(ōu)盟在互聯網時(shí)代沒有創(chuàng)造出一個大型的互聯(lián)網企業(yè),進而(ér)在數據量、雲計算、推理訓練等AI大(dà)模型相關的基礎設施上被持續拉開如今在AI大模生產線模型型領域(yù),歐洲已經很難組織起一場強有力的阻擊,

    但對於中(zhōng)國(guó)企業(yè)來說(shuō),歐洲仍然(rán)是(shì)一個廣闊的市(shì)場中國:最活躍的(de)AI市(shì)場,愛打組合拳許多人可能會認為,中國的AI大模型是從“文心一言”開始的但“文心一言”其實(shí)隻是一個(gè)類ChatGPT的(de)產品(pǐn),背(bèi)後(hòu)驅動它(tā)的AI大模型無(wú)論是百度(dù)、阿裏、還是騰訊、華為都早有布局。

    但有意生產線(xiàn)模型思的(de)是,中(zhōng)國第一個AI大模型並不來自於(yú)這些牛X哄哄的(de)大企業,而是2021年3月由智源研究院發布的“悟道1.0”可(kě)能會有人好(hǎo)奇,智源研究院是個什麽角色,那我告訴你,它是(shì)妥妥的國家隊智源研究院是科技部和(hé)北京市支持的,依托北京(jīng)大(dà)學、清華大學、中國科學院、百度、小米、曠視科(kē)技等(děng)北京人工智能(néng)方麵優勢企業共同建生(shēng)產線模型立的(de)研究機構。

    智源研(yán)究(jiū)院推出的悟道1.0並不是某個大模型的名稱,而是一係列大模型的統稱具體包括我國首個麵向中文的預訓練語言模型悟道·文源(yuán);首(shǒu)個(gè)公(gōng)開的(de)中文通用(yòng)圖文多模態預訓練模型悟道·文瀾,首個具有認知能力的超大規模預訓練模(mó)型悟道·文匯和超大規模蛋白質序列預測預訓練模型悟道·文溯。

    除了發布(bù)了諸多冠名“生產線模型第一”的大(dà)模型之(zhī)外,智源(yuán)研(yán)究院還為中國構建了大規模預訓練(liàn)模型技術體係,並(bìng)建設開放(fàng)了全球最大中文(wén)語料數據庫WuDaoCorpora,為後來其他企業(yè)發(fā)展AI大模型打下了基礎而或許是受“悟(wù)道(dào)1.0”的影響,。

    後來幾乎所有企業(yè),在發布大模型的時候都不止發一個,而是一串比如百度在2019年發布了文心大模型和悟生產線模型(xíng)道AI一樣,文心大模型也是諸多模型的統稱,包括NLP、CV(機器(qì)學(xué)習(xí))、跨模態大模型和生命計算大(dà)模型四個類別36個大模型。

    3月16日,基於文心大模型,百(bǎi)度發布文心一言,成為中(zhōng)國第一個類ChatGPT產品。

    百度文心大模型官網華為在2021年基於昇(shēng)騰 AI 與鵬城實驗室(shì)聯合發布了鵬程盤古大模型盤(pán)古大模型生產線模型包(bāo)括CV和(hé)NLP兩類大模型其中,盤古NLP大模型是業界(jiè)首個千億級中文NLP大模型阿裏在2022年9月發布了“通(tōng)義”大模型係列,包含NLP大模型AlicMind、視覺大模(mó)型CV,多模態大模型M6。

    其中M6大模型是國內首個千億參數多模態大模型目前,阿裏巴巴(bā)“通義”大模(mó)型係列已在超過(guò)200個場(chǎng)景(jǐng)中提(tí)供服(fú)務生產(chǎn)線模型,實(shí)現了2%~10%的應(yīng)用效果提升典型使用場景包括電商跨模態搜索、AI輔助設計、開放域人機對話、法律文書學習、醫療文本理解等。

    同樣在2022年,騰(téng)訊(xùn)發布混(hún)元AI大模型,其中包含NLP、CV和(hé)多模態(tài)等基礎模型和眾多行業(yè)/領域模型到今年(nián)2月初(chū),騰訊混元AI大模型團(tuán)隊再推出萬億中文NLP預訓練模型HunY生產線模型(xíng)uan-NLP-1目前HunYuan-NLP-1T大模型已在騰訊(xùn)廣告、搜索、對話等內(nèi)部產品落地,並通過騰訊雲服務外部客戶。

    到今年2月底,騰訊也開始研發類ChatGPT產品,並已成立“混元助手(HunyuanAide)”項目組商湯(tāng)在3月(yuè)14日發布多模態通用大模型“書生2.5”,擁有30億參數,其圖文(wén)跨生產線模型模態開放任務處理能力可為自動駕駛、機器人等通用場景任務提供感知和理解能力支持。

    “書生(INTERN)”最初版本由商湯科技、上海(hǎi)人工智能實驗室、清華大學、香港中文大學、上海交通大學在2021年(nián)11月(yuè)首次共同發布在此之外(wài),京東在2月10日宣布研發產業版(bǎn)ChatGPT——ChatJD,網易、360、字(zì)節跳生產線模型動等也宣布了在AI大模(mó)型方麵的布局。

    可以說,目前國(guó)內有頭有臉的互聯網企業基本都擁有一個AI大模型,或者製定了相應的計劃而與國外企業大多專注於一個大模型不同,中國企業在大(dà)模型方麵(miàn)的布局並不愛單打獨鬥,而是喜歡(huān)通(tōng)過一個係列來打組合拳另一個特點在於,與(yǔ)國外大模型在實驗室打磨(mó)成熟之外,。

    中國大模(mó)型都是從產業生產(chǎn)線模型端實戰出來的比如阿裏、百度、騰訊的大模型都會應用到廣告推送、社交平台的圖(tú)片識別,內(nèi)容分發等領域因此在中國企業發力(lì)大模型的時候,消費端的用戶感知其實(shí)並(bìng)不強烈,但當你體驗到廣告推送越來越準(zhǔn)確,視頻平台和電(diàn)商平台(tái)的猜你喜歡越來越能Get到你的點(diǎn),後麵都有大模型的功勞。

    在大廠之外,與韓國缺少創(chuàng)業不同,AI大生產線(xiàn)模型模型正在中國帶(dài)動AI大模(mó)型領域的創業風潮從前(qián)美團聯合(hé)創始(shǐ)人王慧文在朋友圈公開組隊開始,阿裏VP賈揚清,創新工場(chǎng)CEO李開複、前搜狗CEO王小川、前(qián)京東AI掌門人周伯(bó)文(wén)、出門問問創始(shǐ)人李誌飛等人紛紛下場創業(yè),據自象限不完全統計,目前下場的大佬已有10位。

    除了創業(yè)之外,中國投資機構(gòu)也在躍躍欲試在王慧(huì)文確生(shēng)產線模型認(rèn)下場(chǎng)AI大模型之後,一張真格基金合夥人戴雨森、劉元與王(wáng)慧文、李誌(zhì)飛喝酒的圖片在網上(shàng)瘋傳(chuán),被認為是AI大模型時(shí)代的標誌性照片目前(qián),王(wáng)慧文的光年之(zhī)外已經確認2.3億美元的新一輪融(róng)資,其中(zhōng)可能包括真格資本和源碼資本。

    除此之(zhī)外,在(zài)奇績創壇2022年11月舉辦(bàn)的2022年秋季路演中,陸奇選擇的55個項目,其生產(chǎn)線模型中就(jiù)有16個項目與大模(mó)型相關(guān)可以(yǐ)說(shuō),AI大模型正在成為中國硬科技投資的一個新風向整體來看,從投資、創業到應用,中國幾乎是目前世界上最活躍(yuè)的市場。

    所以我(wǒ)們大(dà)可不必糾結為什麽ChatGPT沒有發生(shēng)在中國,因為未來仍然大有可為


標簽:

產品推薦

Copyright © 2002-2020 上(shàng)海潤之模型設計(jì)有限公司(sī) 版權所(suǒ)有 展示模型,展品模型,展廳(tīng)模型,展示道具,展廳展品,展品(pǐn)道具,模型定製,模(mó)型公(gōng)司,上海模型公司 備案號(hào):滬ICP備20018260號

13621929115
网站地图 www.17C.com_17.C-起草网登录在线_17c.一起草 在线观看视频_17c.com免费观看入口