Infer News

統一神經網絡設計與範疇理論

按此看原文 – MarkTechPost

在深度學習中，設計神經網路架構的統一框架一直是個挑戰，也是最近研究的焦點。早期的模型是透過它們必須滿足的約束或它們執行的操作順序來描述的。這種雙重方法雖然有用，但缺乏一個有凝聚力的框架來無縫整合這兩種觀點。

研究人員解決了缺乏能夠解決約束規範及其在神經網路模型中實現的通用框架的核心問題。他們強調，目前的方法，包括關注模型約束的自上而下的方法和詳細說明操作序列的自下而上的方法，無法提供神經網路架構設計的整體視圖。這種脫節的方法限制了開發人員針對他們處理的獨特資料結構設計高效且客製化的模型的能力。

來自 Symbolic AI、愛丁堡大學、Google DeepMind 和劍橋大學的研究人員介紹了一種理論框架，該框架透過在 2 類參數映射中評估的單子將約束規範與其實現結合起來。他們提出了一種基於範疇論的解決方案，旨在為神經網路設計創建一種更整合和連貫的方法。這種創新方法概括了神經網路設計的多樣性，包括循環神經網路（RNN），並提供了理解和開發深度學習架構的新視角。透過應用範疇論，該研究捕捉了幾何深度學習 (GDL) 中使用的約束，並擴展到更廣泛的神經網路架構。

所提出的框架的有效性透過其恢復 GDL 中使用的約束的能力得到強調，展示了其作為深度學習通用框架的潛力。 GDL 使用群論視角來描述神經層，透過保持對稱性在各種應用中展現了前景。然而，當面對複雜的資料結構時，它會遇到限制。基於範疇論的方法克服了這些限制，並提供了一種用於實現不同神經網路架構的結構化方法。

這項研究的中心正在應用範疇論來理解和創建神經網路架構。這種方法可以創建與其處理的資料結構更緊密結合的神經網絡，從而提高這些模型的效率和有效性。該研究強調了範疇論作為神經網路設計工具的普遍性和靈活性，為神經網路模型中約束和操作的整合提供了新的見解。

總之，本研究引入了一個基於類別論的突破性框架，用於設計神經網路架構。透過彌合約束規範與其實現之間的差距，該框架提供了一種全面的神經網路設計方法。範疇論的應用不僅恢復並擴展了 GDL 等框架中使用的約束，也為開發複雜的神經網路架構開闢了新的途徑。

Categories: 新聞

如何使用 LangChain 構建 LLM – 初學指南

(英)如何使用 LangChain 構建 LLM – 初學指南

大型語言模型（ LLM ）係非常強大嘅通用推理工具，喺各種情況下都好有用。但是，使用LLM會帶來與構建傳統軟件不同嘅挑戰：*調用往往係長時間運行嘅，並且會流式傳輸生成嘅輸出

从编解码和词嵌入开始，一步一步理解Transformer，注意力机制(Attention)的本质是卷积神经网络(CNN)

Watch this video on YouTube

Categories: 新聞

從編解碼、詞嵌入開始，理解 Transformer 的注意力機制(Attention)，及卷積神經網絡(CNN)

[embedyt] https://www.youtube.com/watch?v=GGLr-TtKguA[/embedyt]

Categories: 新聞

MVSEP – 自制 Karaoke 必備

分離人聲與伴奏

MVSEP將從音頻中分離出人聲與伴奏、從音頻中提取文本，並且免費。使用AI。

新增了新版本的 BSRoformer 權重。目前它可能是世界上最好的可用模型。

Categories: Audio, 線上服務

大規模人工智慧運算時代：高峰論壇系列

拍攝日期：2023/11/27主講人：梁伯嵩（聯發科技前瞻技術平台資深處長、國立臺灣大學資訊工程系與重點科技學院合聘客座教授）主持人：張登及（臺大人文社會高等研究院副院長、國立臺灣大學政治學系教授)講者簡介：梁伯嵩博士任職於聯發科技，擔任前瞻技術平台資深處長，並兼任臺灣大學資訊工程系與重點科技學院合聘客座教授

大規模人工智慧運算的時代：前景、影響及回應 | 高峰論壇系列