從編解碼、詞嵌入開始,理解 Transformer 的注意力機制(Attention),及卷積神經網絡(CNN)
[embedyt] https://www.youtube.com/watch?v=GGLr-TtKguA[/embedyt]
Categories: 新聞
拍攝日期:2023/11/27主講人:梁伯嵩(聯發科技前瞻技術平台資深處長、國立臺灣大學資訊工程系與重點科技學院合聘客座教授)主持人:張登及(臺大人文社會高等研究院副院長、國立臺灣大學政治學系教授)講者簡介:梁伯嵩博士任職於聯發科技,擔任前瞻技術平台資深處長,並兼任臺灣大學資訊工程系與重點科技學院合聘客座教授
新一代開源模型 ChatGLM3-6B 已發佈,擁有10B以下最強的基礎模型,支持工具調用(Function Call)、代碼執行(Code Interpreter)、Agent 任務等功能。