推理引擎 – Page 2

Google 正在模擬整個物理世界

2025 年 1 月 22 日

谷歌最近的人工智慧計畫是模擬整個物理世界的系統，谷歌認為這是通往通用人工智慧的關鍵路徑，以及它如何與谷歌更廣泛的人工智慧策略相連，這當然包括 Gemini。

這是 Google DeepMind 一項突破性的 AI 計畫：建構模擬整個物理世界的系統，以朝向通用人工智能 (AGI) 邁進。該系統整合了多模態數據 (例如影片、音訊和機器人數據)，用以模擬真實世界的物理規律，並將應用於機器人、遊戲和科學研究等領域。這項計畫展現 Google 擴展 AI 模型以達到前所未有的智能和真實感的雄心壯志，並預期將對各產業帶來革命性的影響，加速 AGI 的實現。

Google’s New AI Is Recreating the Whole World to Unlock Superhuman Intelligence

Watch this video on YouTube

Categories: 3D, 多模態模型, 推理引擎, 新聞

Cerebras 和 Groq 等公司利用此技術，在 Llama 模型上取得遠超傳統 GPU 的效能表現，速度提升達數倍。文章詳細解釋了如何取巧進行推理解碼的原理：使用較小的模型快速生成初步答案，再由較大的模型校驗其準確性，類似「助理先打草稿，老闆再審核」的流程。文章後半部提供了使用 Llama.cpp 實作推測解碼的步驟，並說明了其各個參數的意義，以及在實際應用中可能遇到的挑戰，例如偶爾出現的延遲問題，但整體而言，推測解碼能有效提升 LLM 的效能，尤其適用於需要大量運算的應用情境，例如結合思考鏈 (CoT) 的複雜任務。

Categories: 推理引擎

mistral.rs 高速推理引擎

2024 年 12 月 15 日

高效能語言模型推論引擎

它以 Rust 編寫，支援多種模型、量化方法 (GGML, GPTQ, HQQ 等) 和加速器 (CUDA, Metal, CPU)，並提供便捷的 Python API 和 OpenAI 相容的 HTTP 伺服器。核心功能包括快速推論、多種量化技術以提升效能，以及對 LoRA、X-LoRA 等模型調整技術的支援。附詳細說明安裝、建置、模型取得和使用方法，並提供豐富的範例程式碼與效能基准測試結果。(支援 Mac M 系列)

MAC Image

Categories: 開源, 推理引擎

Page 2 of 2

« Previous 1 2