Infer News

用 Ollama 與 AnythingLLM 於本地運行無限 AI 代理 – YouTube

最近 AnythingLLM Desktop 中容許我哋合併 AI Agents。這部影片是了解 Anything LLM 以及如何使用 Olama 在您的設備上本地運行 AI 代理的絕佳介紹。

Unlimited AI Agents running locally with Ollama & AnythingLLM

Watch this video on YouTube

當 Anything LLM 用於代理，可以指示它去執行抓取網站或概括文檔。影片展示瞭如何使用 Anything LLM 與代理一起抓取網站和概括文檔。

Categories: 新聞

GPT-4o vs Google I/O — A.I. 大戰

此影片介紹了 Google I/O 上公布的最新人工智能 (AI) 進展以及 OpenAI 的驚喜更新。

Another glorious battle for AI dominance… GPT-4o vs Google I/O

Watch this video on YouTube

OpenAI 發布了他們的新旗艦模型 GPT-40，它速度更快、更便宜，並將文字、視覺和音頻組合成一個模型。它還可以以多種語氣進行對話，從戲劇性到冷靜。
Google 宣布了 Gemini 1.5 Pro，它現在可以處理 200 萬個令牌上下文窗口。為了解決令牌的成本問題，他們發布了一項名為上下文緩存的新功能，並舉辦了一項開發人員比賽，以構建最好的 Gemini 支持的應用程序。
Google 的另一個有趣公告是 Firebase data connect，它正式將 Postgress 引入 Firebase。
Google 還宣布了新硬件，例如 Trillium tpus 和 Axion 其新的面向數據中心的 ARM 基 CPU，以及 vo，一個生成視頻模型以與 OpenAI Sora 競爭。
視頻以作者對奇點進度的失望結束，因為即使這些模型變得越來越快、越來越便宜，它們也並沒有變得更加智能。

Categories: 新聞

Google 推出 Gemini 1.5 Pro

這是一部關於 Google 將推出新的人工智能 (AI) 產品的影片。影片一開始提到 Google 的 AI 輸給了名叫 Chad GPT 40 的新 AI，不過 Google 馬上宣布了他們即將推出的新產品 Gemini 1.5 Pro。這個新的人工智能能夠讀取並處理比以往更多的資料，可以摘要長達一小時的影片內容。

Google Introduces Gemini 1.5 Pro

Watch this video on YouTube

影片接著展示了其他新的人工智能產品，例如可以根據使用者的指示生成文本內容的视频生成工具，以及可以根據使用者的喜好生成音樂的 AI 作曲家等等。影片中也提到了一些關於人工智能的道德議題，例如人工智能是否會取代人類的工作。

Categories: 新聞

GPT-4″O” 讓你擁有 AI 私人合作伙伴

GPT-40 將提供免費層，更高層將提供更高的使用限制。GPT-40 是 AI 技術的重大飛躍，能夠通過音頻、視覺和文字與世界互動。

INSANE OpenAI News: GPT-4o and your own AI partner

Watch this video on YouTube

GPT-40 的一些主要功能包括：

實時響應：GPT-40 可以實時響應您的問題和請求，使其成為對話和協助的強大工具。
通過語音助手訪問：您可以通過語音助手與 GPT-40 互動，類似於您與 Siri 或 Alexa 互動的方式。這使其非常易於使用。
多模態學習：GPT-40 可以通過文字、音頻和視頻等不同媒介學習和理解信息。這使其對世界的理解比以前的模型更加豐富。
執行多種任務：GPT-40 可用於多種任務，包括翻譯、實時字幕、代碼生成和以信息豐富的方式回答您的問題。

Categories: 新聞

Developer Keynote (Google I/O ’24)

這部影片是 Google I/O ’24 的主題演講，涵蓋了各種與 Google AI 工具相關的主題以及開發人員如何使用它們。

Developer Keynote (Google I/O '24)

Watch this video on YouTube

介紹 Gemini 1.5 Flash：Gemini AI 模型的新版本，旨在高效且低延遲。它非常適合需要快速響應時間的任務。
Project Starfire：一個新工具，允許開發人員使用具有 200 萬個令牌上下文窗口的大型語言模型 (LLM)。這允許開發人員輸入更多信息並獲得更全面的結果。
Project Astra：一個雄心勃勃的項目，旨在創建一個通用 AI 助手。該助手將能夠幫助用戶完成各種日常任務，例如安排約會、查找信息和控制智能家居設備。
Google 如何使用 AI 改進 Web 開發：Google 正在開發多項新功能，這些功能將使開發人員更容易創建快速、無縫和用戶友好的 Web 應用程序。
Google 如何使 AI 開發更易於訪問：Google 致力於使 AI 開發工具更易於所有開發人員使用。他們通過提供各種易於使用的工具和資源來做到這一點。

Categories: 新聞

StockCake：適合各種場合的迷人免費圖片

讓 StockCake 釋放你的創造力

免費下載照片供商業和個人使用。無需署名。在StockCake上探索免費庫存照片：質素和多樣性！

Categories: 新聞

llama3-chinese 中文模型

Llama3-Chinese 以 Meta-Llama-3-8B為底座

使用 DORA + LORA+ 的訓練方法，在50w高質量中文多輪SFT數據 + 10w英文多輪SFT數據 + 2000單輪自我認知數據訓練而來的大模型。

Categories: 新聞

LLaMA-Factory: 高效微調 LLM

相比ChatGLM，LLaMA Factory 的 LoRA 微調提供了 3.7 倍的加速

支持多種模型：LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi

你可選用本地部處或使用 Colab Notbook

項目特色

多種模型：LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi 等等。
集成方法：（增量）預訓練、（多模態）指令監督微調、獎勵模型訓練、PPO 訓練、DPO 訓練、KTO 訓練和 ORPO 訓練。
多種精度：32 比特全參數微調、16 比特凍結微調、16 比特 LoRA 微調和基於 AQLM/AWQ/GPTQ/LLM.int8 的 2/4/8 比特 QLoRA 微調。
先進算法：GaLore、BAdam、DoRA、LongLoRA、LLaMA Pro、Mixture-of-Depths、LoRA+、LoftQ 和 Agent 微調。
實用技巧：FlashAttention-2、Unsloth、RoPE scaling、NEFTune 和 rsLoRA。
實驗監控：LlamaBoard、TensorBoard、Wandb、MLflow 等等。
極速推理：基於 vLLM 的 OpenAI 風格 API、瀏覽器界面和命令行接口。

Categories: 新聞

權重量化簡介

標記為的 LLM Q2_Kⓘ, Q4_K_Mⓘ, Q5_0ⓘ， Q8_0ⓘ 等具有不同的“量化”程度。

量化是指能夠在有限資源的平台上運行模型的技術。這是一個活躍的研究領域。了解更多有關量化的資訊 ↗
選擇「最佳」量化等級通常需要在檔案大小、品質和效能之間進行各種權衡。較高的量化「位數」（4 位或更多）通常可以保留更多的質量，而較低的級別會進一步壓縮模型，這可能會導致質量的顯著損失。選擇與您的硬體功能相符並滿足任務效能需求的量化等級。如果您不確定要選擇哪個選項，請考慮嘗試幾個不同的選項並進行自己的評估。

Introduction to Weight Quantization

Reducing the size of Large Language Models with 8-bit quantization

Categories: 新聞

OpenBioLLM 8B：Llama 3 生物醫學模型登陸iOS/macOS

Private LLM推出了OpenBioLLM-8B

一款適用於iPhone、iPad同Mac嘅尖端生物醫學AI模型。這款安全嘅設備端聊天機械人由Saama AI Labs開發，可在醫療和生命科學應用中提供无与伦比嘅性能。立即試用，體驗高級私有AI嘅強大功能。

Categories: 新聞

Page 39 of 56

« Previous 1 … 37 38 39 40 41 … 56 Next »