国产成人精品免高潮在线观看-国产精品99无码一区二区-国产av人人夜夜澡人人爽-精品国产免费一区二区三区香蕉

<pre id="0s0x8"><fieldset id="0s0x8"></fieldset></pre>

^{<blockquote id="0s0x8"></blockquote>}

<em id="0s0x8"></em>

新聞頻道行業資訊企業動態展會報道人物專訪產品新聞政策法規技術前沿研究報告

傳動網 > 新聞頻道 > 行業資訊 > 資訊詳情

英偉達發布新nGPT架構撬動AI未來

時間：2024-10-22

來源：電子技術應用

導語：10 月 22 日消息，科技媒體 dataconomy 昨日(10 月 21 日)發布博文，報道稱英偉達在訓練 AI 模型方面取得重大突破，發布了最新的 Normalized Transformer(nGPT)新架構，保持模型的穩定性和準確性的前提下，可以將訓練 AI 時間縮短至 1/4 或者 1/20。

　　10 月 22 日消息，科技媒體 dataconomy 昨日(10 月 21 日)發布博文，報道稱英偉達在訓練 AI 模型方面取得重大突破，發布了最新的 Normalized Transformer(nGPT)新架構，保持模型的穩定性和準確性的前提下，可以將訓練 AI 時間縮短至 1/4 或者 1/20。

　　nGPT 架構提升效率的秘訣在于“超球面學習”(Hyperspherical learning)這個概念。

　　傳統的變換器模型通常缺乏一致的幾何框架，而 nGPT 通過將嵌入、注意力矩陣和隱藏狀態等關鍵組件映射到超球面表面，確保模型各層在訓練過程中保持平衡。

　　這種幾何結構有助于創造更穩定高效的學習過程：

　　減少訓練步驟：nGPT 不再直接對模型權重應用權重衰減，而是依賴學習到的縮放參數，優化模型在訓練中的調整方式。

　　簡化過程：此方法消除了對 LayerNorm 或 RMSNorm 等歸一化技術的需求，使訓練過程更為簡單和快速。

　　英偉達團隊使用 OpenWebText 數據集進行測試，nGPT 在速度和效率上均優于傳統的 GPT 模型。對于長達 4000 個 tokens 的文本輸入，nGPT 所需的訓練輪次遠少于傳統模型，顯著縮短了訓練時間。

　　nGPT 的一個關鍵優勢是將歸一化(normalization)和表示學習(representation learning)結合成一個統一框架，這種設計簡化了模型架構，便于擴展和適應更復雜的混合系統。未來，nGPT 的方法可能被整合進其他類型的模型和架構，從而開發出更強大的 AI 系統。

中傳動網版權與免責聲明：

凡本網注明[來源：中國傳動網]的所有文字、圖片、音視和視頻文件，版權均為中國傳動網(www.cdcst56.com)獨家所有。如需轉載請與0755-82949061聯系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”，違反者本網將追究其法律責任。

本網轉載并注明其他來源的稿件，均來自互聯網或業內投稿人士，版權屬于原版權人。轉載請保留稿件來源及作者，禁止擅自篡改，違者自負版權法律責任。

如涉及作品內容、版權等問題，請在作品發表之日起一周內與本網聯系，否則視為放棄相關權利。

下一篇：

中興通訊5G基站和固網產品持續保持全球第二

中興通訊5G基站和固網產品持續保持全球第二

返回新聞首頁

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網公眾號獲取更多資訊

最新新聞

查看更多資訊

延伸閱讀

推薦產品

行業專題

熱門搜索

回頂部

點贊 0

取消 0

網站簡介|會員服務|聯系方式|幫助信息|版權信息|網站地圖|友情鏈接|法律支持|意見反饋|sitemap

傳動網-工業自動化與智能制造的全媒體“互聯網+”創新服務平臺

網站客服服務咨詢采購咨詢媒體合作

Chuandong.com Copyright ?2005 - 2025 ，All Rights Reserved 深圳市奧美大唐廣告有限公司版權所有
粵ICP備 14004826號 | 營業執照證書 | 不良信息舉報中心 | 粵公網安備 44030402000946號

<sub id="t4mej"><rt id="t4mej"></rt></sub>

<style id="t4mej"></style>

<blockquote id="t4mej"><p id="t4mej"></p></blockquote>

<blockquote id="t4mej"><i id="t4mej"><video id="t4mej"></video></i></blockquote>