What is OpenELM?

OpenELM 係一個創新的開放原始碼語言模型家族，專為高效且準確處理自然語言任務而設計。這些模型採用獨特的逐層縮放策略，優化轉換器架構中每個層內參數的配置。此方法可提升整體準確度與效能。

逐層縮放策略：OpenELM 在其轉換器模型的層中有效分配參數，進而提高語言處理任務的準確度。
預訓練且經指令調整的模型：OpenELM 提供一系列具備不同參數大小（270M、450M、1.1B 和 3B）的模型，包含預訓練和經指令調整的版本，以滿足各種使用者的需求。
開放原始碼訓練與推論框架：這些模型是使用 CoreNet 函式庫訓練的，並在開放原始碼授權下提供，鼓勵社群推動的開發與創新。
多用途預訓練資料集：預訓練資料集包含 RefinedWeb、重複資料刪除的 PILE、RedPajama 和 Dolma v1.6 的子集，總計約 1.8 兆個符號，確保廣泛且多樣化的語言理解。
易於整合：OpenELM 模型可透過 HuggingFace Hub 輕鬆取得，提供與現有自然語言處理工作流程的無縫整合。

OpenELM 專為多元的受眾設計，包括自然語言處理、機器學習和人工智慧等領域的研究人員、開發人員和學生。對於那些希望探索和利用進階語言模型於其專案中，且不需要大量運算資源的人員而言，它特別有益。

OpenELM 代表開放原始碼語言模型領域的一大進步，提供強大、多功能且社群驅動的解決方案，適用於廣泛的自然語言處理任務。

More information on OpenELM

Launched

Pricing Model

Free

Starting Price

Global Rank

Month Visit

<5k

Tech used

OpenELM was manually vetted by our editorial team and was first featured on September 4th 2025.

更多替代方案