OpenVINO 2024.5 一體化智能開發 視覺、自動語音辨識、NLP 的深度學習OpenVINO 是一個開源工具包,用於最佳化及部署從雲端到本機的深度學習模型。它利用來自 PyTorch、TensorFlow、ONNX 等流行框架的模型,加速各種深度學習推理,例如生成式 AI、視訊、音訊和語言。轉換和最佳化模型,並在本地和裝置上、瀏覽器或雲端中的各種英特爾® 硬體和環境中進行部署。
opik – 最佳化部署深度學習模型 評估、測試和監控 LLM 的開源平台追蹤開發期間所有的 LLM 調用和追蹤。透過使用 Python SDK 或 UI 記錄回饋分數來註解您的 LLM 呼叫。 Opik 旨在支援大量跟踪,使您可以輕鬆監控生產應用程式。在 Opik 儀表板中查看一段時間內的回饋分數、追蹤計數和令牌
過份強化學習將會獎勵黑客 【人工智能】什么是强化学习中的奖励黑客 | Reward Hacking | OpenAI前安全主管翁荔最新长文 | 奖励函数 | RLHF | 古德哈特定律 | ICRH | 缓释措施Watch this video on YouTube
EchoMimic V2音頻驅動數字人 [20241205 更新] EchoMimic V2更新!自定义数字人动作!|Custom Poses for Your AI Digital HumanWatch this video on YouTube AI数字人新玩法!EchoMimic V2音频驱动,打造超逼真动态角色|AI Digital Human! EchoMimic V2 Audio-Driven AnimationWatch this video on YouTube 【王炸級別開源數字人模型】一款王炸級別的AI數字人開源模型EchoMimicV2模型來啦!支持姿勢+圖片轉數字人+音頻驅動口型,效果炸裂!換上自己喜歡的圖片和音頻,就能打造個人專屬的數字人! MimicMotion具有置信度感知姿勢指導的高品質人體運動影片產生器
SAMURAI – 視訊識別追踪 使用運動感知分段模型以實現零鏡頭視覺跟踪Official repository of “SAMURAI: Adapting Segment Anything Model for Zero-Shot Visual Tracking with Motion-Aware Memory”
Generative Omnimatte – 將影片分層並保留 RGBA Learning to Decompose Video into Layers每一層都由一個完全可見的物件及其相關效果(如陰影和反射)組成。 This AI Learned to Turn a Video Into LayersWatch this video on YouTube