歡迎來(lái)到合肥浪訊網(wǎng)絡(luò)科技有限公司官網(wǎng)
  咨詢服務(wù)熱線:400-099-8848

馬斯克 xAI 推出 Grok-1.5 大言語(yǔ)模型

發(fā)布時(shí)間:2024-03-30 文章來(lái)源:本站  瀏覽次數(shù):1148

馬斯克旗下的xAI公司在近期推出了Grok-1.5大語(yǔ)言模型,這是該公司在AI領(lǐng)域的一項(xiàng)重要進(jìn)展。

Grok-1.5是xAI團(tuán)隊(duì)繼Grok機(jī)器人后推出的又一重要產(chǎn)品,其目標(biāo)是對(duì)標(biāo)ChatGPT等領(lǐng)先的AI大模型。在最新版本的Grok-1.5中,最明顯的改進(jìn)之一是其在代碼和數(shù)學(xué)相關(guān)任務(wù)中的性能得到了顯著提升。在MATH基準(zhǔn)測(cè)試中,Grok-1.5獲得了50.6%的分?jǐn)?shù),在GSM8K基準(zhǔn)測(cè)試中獲得了90%的分?jǐn)?shù),顯示出其在解決復(fù)雜問(wèn)題和處理大數(shù)據(jù)方面的強(qiáng)大能力。

此外,Grok-1.5的另一個(gè)重要升級(jí)是其能夠處理長(zhǎng)達(dá)128K個(gè)標(biāo)記的上下文。這一新功能極大地增加了模型的內(nèi)存容量,使其能夠利用來(lái)自更長(zhǎng)文檔的信息,為處理更復(fù)雜的任務(wù)提供了可能。這一改進(jìn)使得Grok-1.5在理解和處理長(zhǎng)文本方面有了顯著的提升,進(jìn)一步增強(qiáng)了其在各個(gè)領(lǐng)域的應(yīng)用潛力。

在技術(shù)實(shí)現(xiàn)上,Grok-1.5構(gòu)建在基于JAX、Rust和Kubernetes的自定義分布式訓(xùn)練框架之上。這一訓(xùn)練堆棧允許開(kāi)發(fā)團(tuán)隊(duì)能夠以最小的精力構(gòu)建想法原型并大規(guī)模訓(xùn)練新架構(gòu),為先進(jìn)的大型語(yǔ)言模型(LLMs)研究提供了強(qiáng)大而靈活的基礎(chǔ)設(shè)施。

xAI公司的團(tuán)隊(duì)成員來(lái)自DeepMind、OpenAI、谷歌研究院、微軟研究院、特斯拉及多倫多大學(xué)等頂級(jí)機(jī)構(gòu),他們擁有豐富的AI研發(fā)經(jīng)驗(yàn)和技術(shù)實(shí)力,為Grok-1.5的成功推出提供了有力的保障。

總的來(lái)說(shuō),馬斯克xAI推出的Grok-1.5大語(yǔ)言模型在性能和功能上都取得了顯著的進(jìn)步,有望在AI領(lǐng)域掀起新的技術(shù)浪潮。隨著AI技術(shù)的不斷發(fā)展,我們期待xAI能夠繼續(xù)推出更多創(chuàng)新產(chǎn)品,為人類解決更多的復(fù)雜問(wèn)題提供幫助。

上一條:往后青島地鐵可刷數(shù)字人民...

下一條:字節(jié)酒旅整個(gè)事業(yè)部撤銷?...