庫 – Infer News

FrankenMotion 人體動作生成框架

FrankenMotion 是一個以擴散模型為基礎的文本到人體動作生成框架，專注於對單一動作的各個身體部位進行細緻控制。研究團隊先建立名為「FrankenStein」的大規模運動資料集，這份資料集以大型語言模型自動生成的原子化、具備時間感知的逐部份文字敘述，填補了先前資料集只能提供全局或動作層級標註的不足。透過這些高度結構化的部位標註，模型能夠在訓練時同時學習空間（哪個部位在動）與時間（每個部位的具體時間模式）兩層資訊。

實驗結果顯示，相較於先前的 UniMotion、DART、STMC 等模型，FrankenMotion 在語義正確性與運動真實感上都有顯著提升，甚至能創造出訓練時未曾見過的組合動作，例如在坐下的同時抬起左手。

Categories: 庫, 模型, 編程, 開源, Robotic

NexaSDK 全模型支持，全硬件兼容

NexaSDK 是一個高性能的本地推理框架，可以在 NPU、GPU 和 CPU 上運行最新的多模態 AI 模型，支持 Android、Windows、Linux、macOS 和 iOS 設備。它只需幾行代碼，就能在設備上搭建最智能、最快的 AI 應用。NexaSDK 支持最新的模型，比如 Qwen3-VL、DeepSeek-OCR、Gemma3n 等，且比其他框架提前幾周或幾個月支持。。

使用 NexaSDK 建立真正的裝置端 AI 應用，將有獲得獎勵。（詳情)

另外，NexaSDK 還提供了一個簡單易用的命令列介面（CLI），讓使用者可以快速測試不同的模型。例如，你可以用一行指令就開始與 Qwen3 模型聊天，或者進行多模態任務，比如拖曳圖片到 CLI 裡進行處理。

Categories: 庫, 編程, 開源

Top 0.1% AI Researchers – BYTES LLM Inputs

這是 AI 領域的「秘密突破」，僅有頂尖 0.1% 的研究者知曉：直接將原始位元組（raw bytes）輸入大型語言模型（LLMs），並使用代數拓撲（algebraic topology）分析，透過持久同調（persistent homology）揭示傳統模型無法察覺的隱藏資料結構。這可能改變 AI 處理多模態資料（如文字、影像、影片）的未來。

SECRET: Top 0.1% AI Researchers - BYTES LLM Inputs - Topology - Persistent Homology - Episode 1

Watch this video on YouTube

(more…)

Categories: Embedding, 庫, 教學, 深度學習, 編程

DeepEP 高速通信庫

DeepEP 是一個針對（MOE）和專家並行性（EP）的混合通信庫。它提供了高通量和低延遲的全 gpu 內核，它們稱之為 MOE 調度和組合。同時支持低精度的操作，包括 FP8。DeepSeek 公佈本星期將會是開放源碼週（OpenSourceWeek），並將會相繼推出五個開源軟件庫。他們昨日已經開放第一個代碼庫 FlashMLA。DeepSeek 今日繼續開放創新的底層架構 DeepEP，是首個用於 MoE 模型訓練和推理的 EP 通信庫。

Categories: 庫, 編程