LlamaIndex:用 Colab 建立向量資料庫 (RAG) (英)官方教學 Building RAG from Scratch (Open-source only!)本教程展示如何建立向量資料庫,建立檢索管道。值得注意的是,這是個完全開源的方案
Llama3 RAG on Google Colab(附源碼) (英)Llama3 RAG on Google Colab使用 Llama 3、LangChain、ChromaDB 和 Gradio 建立一個檢索增強生成 (RAG) 系統。
了解 Transformer “Attention is All You Need” Attention is All You Need (Transformers)Transformer 在 2017 年問世。筆者試圖解釋 Transformer 最具革命性的 「注意力」
人工智慧遊樂場 | 並排比較頂級人工智慧模型 (英) GPT-4o,Mistral 至 Llama3 的即時比較Chat and compare OpenAI GPT, Anthropic Claude, Google Gemini, Llama, Mistral, and more.
Meta Chameleon – 多模態開源模型 (英)Meta 的 FAIR 團隊公開 Chameleon 模型於研究用Chameleon 的成功在於其完全基於 Token 的架構。模型將會同時學習圖像和文字,進行聯合推理,這對於分開編碼器的模型來說,令推理更接近 Reasoning 的要求,儘管存在一些限制。
Florence-2 (Microsoft)開源模型 – 影像識別 (英)輕量級視覺語言模型模型在字幕、物件偵測、接地和分割等任務中展示了強大的零樣本和微調功能。 繼 Meta 推出多模態 open source 模型,Microsoft 也不甘後人,推出影像識別 Open source Florence-2 模型 儘管尺寸很小,但它所取得的結果與大許多倍的模型(如 Kosmos-2)相當。該模型的優勢不在於複雜的架構,而在於大規模的 FLD-5B 資料集,其中包含 1.26 億張影像和 54 億個綜合視覺註釋。