精品人妻少妇嫩草AV无码专区_亚洲欧美综合一区二区三区_毛片在线播放a_人人鲁免费播放视频

您好,歡迎瀏覽深圳銷毀公司_文件銷毀_過期食品銷毀_過期化妝品銷毀-廣東益福深圳銷毀公司

深圳銷毀公司_文件銷毀_過期食品銷毀_過期化妝品銷毀-廣東益福深圳銷毀公司

深圳銷毀公司,過期食品銷毀,過期化妝品銷毀,文件銷毀,電腦硬盤銷毀,保密資料銷毀,電子產品銷毀,服裝銷毀,假冒偽劣產品銷毀
  您當前所在位置:首頁 > 惠州銷毀公司

深圳銷毀公司:280萬大模型中文開發者拿到最終一塊拼圖

時間:2024-07-20 10:22

2023年5月,微軟CEO納德(de)拉拋出(chu)一(yi)個驚人(ren)數(shu)字,將(jiang)來全球的開發者(zhe)數(shu)量將(jiang)要(yao)達到10億。

那時(shi)候(hou)Meta的Llama已經開(kai)源4個月,但(dan)一些大陸(lu)的開(kai)發(fa)者(zhe)呈(cheng)現,從小以英文語料喂養起來的Llama,對中(zhong)文地球(qiu)并不友(you)好。

這將來(lai)的“10億”開(kai)發(fa)者里(li)會(hui)有(you)多少中文開(kai)發(fa)者,這個問題(ti)難(nan)以推斷,但至(zhi)少已經有(you)755萬人了。

圖源備注:圖片(pian)由AI生成,圖片(pian)授權服務商Midjourney

755萬人,這是2023年在GitHub上注冊的中國(guo)程序員數量,現時的程序員一定會是未來(lai)大模型的第一批(pi)開發者。

有不少人曾經是了。

在(zai)浙江(jiang)省電(dian)力(li)設計院工作的(de)(de)(de)陶佳,測驗用一個開源(yuan)的(de)(de)(de)大模型來做基于(yu)私(si)有知識(shi)庫的(de)(de)(de)檢索問答類應用。他所面(mian)對(dui)的(de)(de)(de)場景很突出(chu),經常需(xu)要從(cong)幾十(shi)萬甚至(zhi)上(shang)百萬字的(de)(de)(de)文檔中查找(zhao)內容。陶佳的(de)(de)(de)專注(zhu)是電(dian)力(li)系統控(kong)制優化,里面(mian)有一些結(jie)合(he)了傳統數(shu)學(xue)方(fang)法和AI方(fang)法的(de)(de)(de)領域,因此對(dui)AI有基本認識(shi),也從(cong)去年(nian)底就一直在(zai)關(guan)注(zhu)著這波(bo)大模型的(de)(de)(de)浪(lang)潮。

他試了幾款,試下(xia)來通義千問(wen)是最好的(de)。“準確,而且‘手感’很(hen)好,沒有那(nei)些出格古怪的(de)bug”,他說。

要做的(de)事也很簡單。有一些(xie)基(ji)本的(de)軟硬件基(ji)礎后,在家(jia)里買(mai)個(ge)服(fu)(fu)務(wu)器(qi)、扔三四塊(kuai)顯卡上去,下載通義千問(wen)、讓(rang)它在服(fu)(fu)務(wu)器(qi)上運行,再(zai)搞個(ge)FRP反向代理,從阿里云上買(mai)最便宜(yi)的(de)30多塊(kuai)錢一個(ge)多月的(de)服(fu)(fu)務(wu)就(jiu)行,這(zhe)樣(yang)就(jiu)能通過(guo)外(wai)網訪(fang)問(wen)家(jia)里的(de)服(fu)(fu)務(wu)器(qi),在單位里也能用通義千問(wen)做實驗。

當一(yi)個開(kai)源生態開(kai)始成型,這(zhe)樣(yang)的開(kai)發者(zhe)也一(yi)步步變多。

開始閉環的開源生態

陶佳對大模型(xing)最深處(chu)的盼(pan)望(wang)來自一個(ge)終(zhong)極(ji)問題:人類能否成(cheng)為(wei)上帝?

美國的(de)(de)未來學家庫(ku)茲韋(wei)爾(er)在2023年已經提出(chu)過這種或(huo)然性。庫(ku)茲韋(wei)爾(er)的(de)(de)想(xiang)象里,人(ren)類到2030年將(jiang)能(neng)夠成為半機器人(ren)。通過在腦中植入納米機器人(ren),人(ren)類將(jiang)抑或(huo)直接(jie)接(jie)入互聯網(wang),智力將(jiang)變得更高,并且將(jiang)擁有(you)幽默、音(yin)樂和愛等快樂的(de)(de)天(tian)賦和能(neng)力。人(ren)類將(jiang)成為像(xiang)上帝(di)相像(xiang)的(de)(de)完(wan)美存在。

那一年OpenAI方才建立,但8年前庫茲韋爾(er)的設想放到當下還是有(you)同(tong)樣的地(di)方,只不過當今看起來好像(xiang)在一個(ge)機(ji)器人(ren)(Agent)中注入意識(shi)和人(ren)性,這條路(lu)好像(xiang)更近點——也就是AGI。

但哪(na)怕(pa)技術是(shi)爆炸、是(shi)躍遷式(shi)的,當下離AGI還(huan)很遠(yuan)。倘或(huo)說(shuo)AGI會再造(zao)一個(ge)新(xin)的世界,那當今人類(lei)對(dui)大(da)模(mo)型(xing)的祈望,繼續是(shi)在現實(shi)(shi)基礎上改造(zao)地球。而這首先需(xu)要建立在我(wo)們知道這個(ge)天下是(shi)什么狀貌的,哪(na)里需(xu)要被(bei)改造(zao)。世界真實(shi)(shi)的聲音需(xu)要被(bei)聽(ting)到(dao),建立一條通道格外重大(da)。

大模(mo)型時代的開源,意義就在這里(li)。來自不同現(xian)實場景(jing),又具(ju)有(you)代碼能力的人們需(xu)要一個廣場,來讓技術主動和(he)場景(jing)對齊,然(ran)后(hou)具(ju)有(you)代表性(xing)的產品(pin)才或然(ran)涌現(xian)。

這(zhe)個廣(guang)場(chang)要(yao)供大家(jia)互動用(yong),還要(yao)有充足且價(jia)格合(he)適的(de)(de)(de)算力資源,同時也需要(yao)足夠充實的(de)(de)(de)可調用(yong)模(mo)型來做選擇。開發者要(yao)的(de)(de)(de)是(shi)這(zhe)樣一個閉環的(de)(de)(de)開源生態,通(tong)義千問的(de)(de)(de)特長(chang)開始浮現(xian)出來。

算力(li)(li)是關于(yu)大模型所(suo)有想(xiang)象力(li)(li)的基礎(chu)。通(tong)義千(qian)問(wen)背后的阿里云擁有我(wo)國(guo)最(zui)強的智(zhi)(zhi)能(neng)算力(li)(li)儲備作為基礎(chu)設(she)施支持。其(qi)智(zhi)(zhi)算集(ji)群(qun)可(ke)達最(zui)大十萬卡(ka)GPU規(gui)模,這意味(wei)著在阿里云上允(yun)許(xu)承(cheng)載多個萬億(yi)參數大模型同(tong)時在線(xian)訓練,為大規(gui)模AI集(ji)群(qun)供應無擁塞通(tong)訊的自(zi)研RDMA網絡架構和低成本高可(ke)靠的高性能(neng)存儲CPFS。

而在(zai)4月,阿里(li)云(yun)在(zai)推出通義千問的同時,也(ye)發(fa)表了(le)史上(shang)最大幅度的一次降價(jia),對比上(shang)一代主售產品最高可下降40%的同時,還開放了(le)計算、存儲(chu)、數據庫、機(ji)器學(xue)習等核心產品免費試用的機(ji)會。這為大批新(xin)涌入的AI開發(fa)者供給了(le)測驗和試錯(cuo)的機(ji)會。

在(zai)阿(a)里云的算力(li)支撐(cheng)下,像陶(tao)佳相像的開發者開始(shi)帶著“野心”涌入魔搭社區(qu)。

去年(nian)11月的云棲大會(hui)上,阿里(li)云與CCF開(kai)源(yuan)發展(zhan)委員會(hui)合(he)伙推出(chu)AI模型社區(qu)“魔搭(da)(da)”ModelScope,在社區(qu)上線(xian)同時獻出(chu)了300多個AI模型,全面開(kai)源(yuan)開(kai)放,其中超(chao)過(guo)(guo)1/3為中文模型。上線(xian)一年(nian)后,魔搭(da)(da)社區(qu)上的AI開(kai)發者數量(liang)早已(yi)超(chao)過(guo)(guo)280萬人,AI模型超(chao)過(guo)(guo)2300+,下載超(chao)過(guo)(guo)1億+。

隨著大模型的熱潮轉向Agent,魔搭(da)社區(qu)在今年9月推(tui)出(chu)了(le)AI Agent開發框架ModelScope-Agent,并(bing)且搭(da)建了(le)一個(ge)“打(da)樣產品”ModeScopeGPT,它允許調用(yong)(yong)社區(qu)里眾多AI模型的API,然后自主兌現人類布置(zhi)的任務(wu)。這(zhe)個(ge)ModeScopeGPT 的調用(yong)(yong)量早已超過(guo)了(le)40萬(wan)次。

除了(le)通(tong)義千問之(zhi)外(wai),Llama2、智譜AI、百川智能甚至最(zui)新推出大(da)(da)模型(xing)的零(ling)一萬物等近百款開(kai)源模型(xing)日前都已經(jing)(jing)進入(ru)社區(qu)。并且(qie)“正在(zai)(zai)中國有(you)一半大(da)(da)模型(xing)公司跑(pao)在(zai)(zai)阿里云(yun)上”,阿里云(yun)CTO周(zhou)靖(jing)人在(zai)(zai)2023年云(yun)棲大(da)(da)會上這(zhe)樣(yang)說的時(shi)候,魔搭已經(jing)(jing)是現在(zai)(zai)我國規(gui)模最(zui)大(da)(da)、用戶(hu)最(zui)活躍(yue)的AI模型(xing)開(kai)源地。

今朝增加的參數量

12月1日(ri),阿(a)里云舉行通(tong)義(yi)千(qian)問發表會,開(kai)源(yuan)了通(tong)義(yi)千(qian)問720億參數(shu)模(mo)(mo)型Qwen-72B。在(zai)參數(shu)量上(shang)這(zhe)是此刻(ke)國內主流視線中最大(da)的(de)開(kai)源(yuan)大(da)模(mo)(mo)型,而在(zai)能力(li)上(shang),Qwen-72B的(de)性(xing)能曾經在(zai)測驗(yan)中超越(yue)開(kai)源(yuan)標桿Llama2-70B。

Qwen-72B的(de)(de)訓練基(ji)礎(chu)是3T tokens的(de)(de)高(gao)品(pin)質數據,它采用了更(geng)多的(de)(de)參(can)數和(he)訓練數據,完成(cheng)了全面的(de)(de)性能提升。這(zhe)個(ge)模型延續了通義千問預訓練模型的(de)(de)卓越展(zhan)示,在10個(ge)權威測(ce)驗中取得(de)開源模型中的(de)(de)最(zui)佳成(cheng)績,并(bing)在某些評測(ce)中超越了非公(gong)開的(de)(de)GPT-3.5和(he)GPT-4。

在(zai)英(ying)語任(ren)(ren)務方面,Qwen-72B在(zai)MMLU基準嘗試中(zhong)獲得開源(yuan)模(mo)型中(zhong)的最高分。在(zai)中(zhong)文任(ren)(ren)務中(zhong),它(ta)在(zai)CEVAL、CMMLU、Gaokao等評測中(zhong)領先,甚至超(chao)過了GPT-4。在(zai)數學推理領域,Qwen-72B在(zai)GSM8K、MATH評測中(zhong)遠超(chao)其他開源(yuan)模(mo)型。同時,在(zai)代(dai)碼(ma)理解任(ren)(ren)務上(shang),經過HumanEval和MBPP評測,Qwen-72B展(zhan)示了顯著的進步,其代(dai)碼(ma)能力實(shi)現了質的飛躍。

從8月初開始(shi),Qwen-7B和Qwen-7B-Chat兩(liang)款開源模(mo)型(xing)(xing)在(zai)魔(mo)搭社區上線開始(shi),通(tong)義千問自身的模(mo)型(xing)(xing)開源開始(shi)提上日程。8月25日,以(yi)Qwen-7B為(wei)基座語(yu)言模(mo)型(xing)(xing)創想(xiang),支(zhi)持圖文輸(shu)入(ru),具備(bei)多模(mo)態(tai)報道理解能(neng)力大規模(mo)視覺(jue)語(yu)言模(mo)型(xing)(xing) Qwen-VL開源。

Qwen-VL開(kai)源(yuan)(yuan)的一(yi)個(ge)月(yue)以后,阿(a)里云在9月(yue)25日開(kai)源(yuan)(yuan)了通義(yi)千(qian)問百億(yi)級的參數模(mo)型(xing)Qwen-14B及其對話(hua)模(mo)型(xing)Qwen-14B-Chat。這款模(mo)型(xing)在性能上開(kai)始頭一(yi)回看向(xiang)Llama-70B,添加前(qian)幾款開(kai)源(yuan)(yuan)的模(mo)型(xing),一(yi)個(ge)多月(yue)時間內在開(kai)源(yuan)(yuan)社區的下載量突(tu)破100萬(wan),在性能和可用性的平衡上,70億(yi)和140億(yi)參數的尺寸也(ye)是對開(kai)發者最(zui)友好的。

但(dan)當這個大模(mo)型(xing)(xing)開(kai)源生態開(kai)始走深,開(kai)發者對模(mo)型(xing)(xing)的性能(neng)上限有了(le)更(geng)高的要求(qiu),也(ye)就需要更(geng)大參數的模(mo)型(xing)(xing)。Qwen-72B開(kai)始吸引到一(yi)些初創(chuang)團(tuan)隊的目光。

“我對72B的(de)模型(xing)抱有(you)特別大(da)的(de)冀望,好奇(qi)72B在我們領域中的(de)能力極限值。”

顏鑫是華東(dong)理工大(da)學X-D Lab(心動實驗(yan)室(shi))的成員,X-D Lab實驗(yan)室(shi)之前的商討方(fang)向包括社(she)會計(ji)算(suan)與(yu)社(she)會智能(neng)、群體智能(neng)與(yu)隱私(si)保護、公共(gong)衛生與(yu)輿情監(jian)測、工業智能(neng)與(yu)智能(neng)系(xi)統(tong)等方(fang)面,大(da)模(mo)型顯現之后,開始聚(ju)焦AI情感計(ji)算(suan)領域。

基于開(kai)源的(de)通義(yi)千問基座模(mo)型,顏(yan)鑫和(he)其(qi)他團隊(dui)成(cheng)員(yuan)陸(lu)續開(kai)發了心理健(jian)壯大模(mo)型 MindChat(漫談)、醫療壯健(jian)大模(mo)型 Sunsimiao(孫思邈(miao))、教育/考試大模(mo)型 GradChat(錦鯉)三款垂直領域大模(mo)型,目下(xia)已有超(chao)過20萬人次使用過這三款大模(mo)型,累計供應了超(chao)過100萬次的(de)問答服(fu)務。

推敲到計算(suan)資源的限制以及(ji)一些(xie)客戶對于私有(you)化部署的需(xu)求,顏鑫表態當前團(tuan)隊在供給問答服務時7B或(huo)14B尺寸的大(da)模型(xing)是更(geng)合適的選擇(ze),但在更(geng)開放的學術推敲上——譬如怎么利用(yong)聯(lian)邦學習算(suan)法處置(zhi)數據——Qwen-72B有(you)著前者不具備的性能特(te)長。

而開源模型(xing)參數量的向上思慮,未來也有(you)機會推動ModelScope-Agent這樣關于怎樣接近AGI的暢想更接近現實。

此(ci)前在(zai)阿里(li)從事大(da)數據(ju)業(ye)務近7年的(de)秦續業(ye),刻下(xia)身(shen)份是將來速度Xorbits配(pei)合創(chuang)始人&CEO。Xorbits打造了公司級的(de)分布式推(tui)理(li)框(kuang)架Xinference。通(tong)過Xinference,開(kai)源(yuan)模型允許降落在(zai)個(ge)人用(yong)戶和開(kai)發者的(de)個(ge)人電腦上,企業(ye)用(yong)戶抑或(huo)在(zai)計(ji)算(suan)集群上輕松(song)部署并(bing)管理(li)模型,享受私有化(hua)部署帶來的(de)安(an)全、定制化(hua)以及低成本。

秦續業表態,如(ru)若外接知識庫做問答應用(yong),經過大模型召回一些(xie)數據,放到(dao)上下文中進(jin)行(xing)總結,最后給出有用(yong)的(de)(de)(de)回應,那么小(xiao)尺寸(10B以下)的(de)(de)(de)模型是夠用(yong)的(de)(de)(de)。要是需要具(ju)備一定(ding)的(de)(de)(de)邏(luo)輯推理(li)能(neng)力(li)的(de)(de)(de)模型,20-30B的(de)(de)(de)中等尺寸模型是比較好的(de)(de)(de)選擇。

“但在(zai)Agent也許需要強大推(tui)理能(neng)力的場景中,70B+的大模型會更有優(you)勢(shi)。”

AI Agent是(shi)秦續業遠處的(de)冀望,但他相仿也是(shi)個現實主(zhu)義(yi)者。眼下(xia)把模型用起來(lai)是(shi)更(geng)緊(jin)要的(de)事情(qing),所以Xorbits曾經攻克(ke)的(de)焦點,是(shi)讓通(tong)義(yi)千問跑在一臺Mac電腦上。

秦續業覺得這一點能擊中很多(duo)人。因為很多(duo)開發(fa)者都(dou)是用Mac電(dian)腦,他們直奔在本地拉起Qwen序(xu)列(lie)模型,允許極大提(ti)升開發(fa)影響。

Qwen類別的全尺(chi)寸(cun)完(wan)善不(bu)止一個72B的大(da)參數(shu)模型。與Qwen-72B同步,阿里云這次開源了(le)通義(yi)千問18億參數(shu)模型Qwen-1.8B和通義(yi)千問音頻大(da)模型Qwen-Audio,至此,通義(yi)千問開源光(guang)譜(pu)早已(yi)了(le)覆蓋(gai)從18億、70億到(dao)140億、720億參數(shu)的4款大(da)語言(yan)模型,以及視覺理解(Qwen-VL)、音頻理解兩款多模態大(da)模型。

大(da)模型(xing)(xing)的開(kai)源生態,這是(shi)AI時(shi)代最后(hou)抑或洶(xiong)涌而來的一味藥引。周靖人對通義千問的定位是(shi)“AI時(shi)代最開(kai)放的大(da)模型(xing)(xing)”,眼前打點好(hao)一切,靜(jing)待開(kai)發(fa)者入場了。

(舉報)

上一篇:沒有了

版權所有 廣東(dong)益福再生(sheng)資源回(hui)收(shou)有限公司