歐洲最大的開源項(xiàng)目:Sber發(fā)布了一系列先進(jìn)的俄羅斯神經(jīng)網(wǎng)絡(luò)模型。此外,Kandinsky 5.0新系列中的所有圖像和視頻生成模型——Video Pro, Video Lite和Image Lite均已可用。這些先進(jìn)的神經(jīng)網(wǎng)絡(luò)本地支持俄語提示,了解俄羅斯文化,并能夠在圖像和視頻上書寫西里爾文字。同時(shí),還發(fā)布了用于視覺數(shù)據(jù)壓縮的K-VAE 1.0模型,該模型是世界上同類開源模型中的最佳,且對(duì)于訓(xùn)練視覺內(nèi)容生成模型至關(guān)重要。所有這些模型的代碼和權(quán)重現(xiàn)已通過MIT許可證向所有用戶開放,包括商業(yè)用途。
Sber開放了GigaChat系列中兩款新的旗艦MoE模型——Ultra-Preview和Lightning的權(quán)重,這些模型從零開始專為俄語任務(wù)打造,同時(shí)還推出了新一代開放式GigaAM-v3模型,用于帶標(biāo)點(diǎn)符號(hào)和規(guī)范化的語音識(shí)別。
Sber高級(jí)副總裁、技術(shù)發(fā)展部門負(fù)責(zé)人安德烈·貝列夫采夫(Andrey?Belevtsev)表示:
打造真正的世界級(jí)人工智能需要兩樣?xùn)|西:巨大的資源,更重要的是世界頂級(jí)的研發(fā)團(tuán)隊(duì)。Sber擁有這兩者。但我們的基本立場(chǎng)是不建設(shè)“封閉”的技術(shù)。我們的戰(zhàn)略是成為全國(guó)開放的基礎(chǔ)。因此我們開放了模型權(quán)重。這是關(guān)鍵點(diǎn)。當(dāng)我們開放模型時(shí),俄羅斯任何公司,從銀行到初創(chuàng)企業(yè),都可以在其封閉環(huán)境中安裝模型,并在不向任何人泄露敏感數(shù)據(jù)的情況下進(jìn)行微調(diào)。這就是真正的技術(shù)主權(quán),AI屬于整個(gè)國(guó)家,并成為業(yè)務(wù)轉(zhuǎn)型和經(jīng)濟(jì)增長(zhǎng)的基礎(chǔ)。我還想指出,Ultra模型很快也會(huì)面向企業(yè)客戶發(fā)布,優(yōu)化擁有成本適合在公司內(nèi)部部署。

GigaChat?Ultra和GigaChat?Lightning
GigaChat系列迎來新成員:GigaChat Ultra Preview和GigaChat Lightning。GigaChat Ultra Preview是GigaChat系列中最強(qiáng)大、最大的模型。這是俄羅斯首個(gè)如此規(guī)模的模型,雖然仍在訓(xùn)練過程中,但在當(dāng)前階段,它已經(jīng)在俄語質(zhì)量指標(biāo)(MERA基準(zhǔn)測(cè)試領(lǐng)先)上超過了DeepSeek V3.1和之前的旗艦?zāi)P虶igaChat Max 2。Ultra-Preview采用開放許可,將允許在本地環(huán)境中微調(diào),比如在對(duì)隱私、信息安全與質(zhì)量要求嚴(yán)格的封閉企業(yè)環(huán)境中。盡管模型很大,但速度足夠快,比GigaChat 2 MAX更快。相反,GigaChat Lightning是系列中最緊湊、最快的MoE模型,優(yōu)化為可在筆記本本地運(yùn)行,支持快速產(chǎn)品迭代。其質(zhì)量與全球開源領(lǐng)域領(lǐng)導(dǎo)者競(jìng)爭(zhēng),在俄語任務(wù)上超過Qwen3-4B,在對(duì)話、文檔分析及業(yè)務(wù)應(yīng)用中表現(xiàn)不俗。和Ultra一樣,不僅公開模型權(quán)重,還公開了加速推理技術(shù):Lightning在同類中速度領(lǐng)先,接近Qwen3-1.7B速度,體積卻大6倍。兩者均有效整合了第三方工具系統(tǒng),尤其是代碼與記憶功能。代碼工具可執(zhí)行、分析和可視化程序,實(shí)時(shí)運(yùn)行代碼片段,繪制圖表,計(jì)算及驗(yàn)證假設(shè)。記憶系統(tǒng)個(gè)性化交流,保存目標(biāo)、偏好和對(duì)話歷史,實(shí)時(shí)調(diào)整建議,過時(shí)或敏感信息會(huì)被清除,用戶也可手動(dòng)調(diào)整模型記憶。
GigaAM-3
GigaAM-v3是包含5款俄語自動(dòng)語音識(shí)別(ASR)模型的開放套件,面向工業(yè)與商業(yè)應(yīng)用。該套件支持語音助手、呼叫中心、電話分析、語音消息聚合及多模態(tài)代理。新版聲學(xué)模型預(yù)訓(xùn)練規(guī)模從5萬小時(shí)擴(kuò)增到70萬小時(shí),加入了呼叫中心、音樂檢索、帶特征口音和自然講話等新領(lǐng)域,顯著提升了這些場(chǎng)景的識(shí)別質(zhì)量。基于獨(dú)特的基礎(chǔ)模型GigaAM-v3,可以開發(fā)各類語音技術(shù);Sber已用于語音識(shí)別、語音合成,并支持GigaChat處理視頻和音頻。
Kandinsky 5.0
Kandinsky 5.0系列包含Image Lite模型,支持文本生成圖像及編輯,及兩款視頻生成模型:快速的Video Lite和強(qiáng)大的Video Pro,均能根據(jù)文本描述生成視頻并“活化”圖像。通用模型Image Lite支持高清視頻分辨率,熟悉俄羅斯文化代碼,能本地理解俄語和英語指令,能生成拉丁字母和西里爾字母的文字。Video Pro能生成10秒24fps高清短視頻,是目前最優(yōu)開源模型,超過Wan 2.2 A14B,視覺質(zhì)量達(dá)到全球頂級(jí)專有模型Veo 3的水平。為降低集成門檻,Video Lite優(yōu)化支持12GB以上家用顯卡。訓(xùn)練使用近10億圖像及3億視頻,為本土文化適配額外使用了逾百萬媒體素材。大規(guī)模數(shù)據(jù)訓(xùn)練采用多項(xiàng)前沿方法,有專門團(tuán)隊(duì)挑選高質(zhì)量數(shù)據(jù),保證作品構(gòu)圖、風(fēng)格及視覺質(zhì)量。Kandinsky模型打造了從個(gè)人創(chuàng)作服務(wù)到專業(yè)產(chǎn)業(yè)工具的廣泛產(chǎn)品線。基于開放模型,開發(fā)者和公司可打造便于用戶生成個(gè)性化視頻祝賀、照片“活化”及原創(chuàng)視覺故事的解決方案。對(duì)導(dǎo)演、設(shè)計(jì)師、市場(chǎng)營(yíng)銷及動(dòng)畫師等專業(yè)人士,Kandinsky 5.0產(chǎn)品是強(qiáng)勁的商業(yè)宣傳材料及視覺內(nèi)容制作工具,推動(dòng)俄羅斯生成技術(shù)開放生態(tài)發(fā)展。
K-VAE 1.0
生成模型如Kandinsky 5.0在“人眼不可見”的隱空間合成媒體內(nèi)容,提升訓(xùn)練效率、加速計(jì)算、降低內(nèi)存需求。Sber發(fā)布了自主研發(fā)的K-VAE 1.0自編碼器,分別用于2D圖像和3D視頻,支持媒體內(nèi)容與隱空間相互轉(zhuǎn)換。K-VAE 1.0是同類開源模型中的世界領(lǐng)先產(chǎn)品,其開放使用將助力生成型人工智能技術(shù)實(shí)現(xiàn)新飛躍。



