▲OpenAI公布最新o3推理模型。(資料照/路透)
記者王致凱/綜合報導
Open AI美國時間16日公布最新人工智慧模型「o3」,據稱該模型是首次能夠「用圖像思考」的人工智慧模型,意味著它可以理解並分析用戶上傳的草圖或者圖表,即使這些圖像的品質不高,o3模型也能思考其答案。
根據CNBC報導,OpenAI此次發表的主要新推理模型o3,同時還發表了名為「o4-mini」的較小型模型,是自去年9月推出o1模型後,再次推出推理模型,並稱該模型專注於解決複雜問題,並且可以透過多個步驟來思考答案。
OpenAI表示,使用o3模型,用戶可以上傳白板筆記、草圖或其他影像,讓人工智慧進行分析與討論。該模型還可以旋轉、縮放或使用其他圖像編輯工具。Open指出,這是推理模型首次能夠獨立使用所有ChatGPT工具,如網頁瀏覽、Python、圖像理解和圖像生成等,有助於更有效解決複雜問題,並且朝著獨立行動邁進。
OpenAI說,o3模型專門針對數學、編碼、科學和理解圖像進行調整,而o4-mini模型則運行速度更快。OpenAI表示,o3 和 o4-mini模型是首個能夠「用圖像思考」的人工智慧模型,這代表它們不僅能看到圖像,還能直接將視覺訊息整合到推理鏈之中。
OpenAI自2022年底推出ChatGPT聊天機器人以來,該公司一直快速升級其人工智慧模型,使其工作範圍不僅能生成文本,還能生成圖像、語音或影像。目前,該公司於人工智慧領域保持領先地位,但面臨來自谷歌等競爭對手的挑戰。
標題:OpenAI首個能「圖像思考」模型! 視覺訊息直接整合進推理鏈
聲明: 本文版權屬原作者。轉載內容僅供資訊傳遞,不涉及任何投資建議。如有侵權,請立即告知,我們將儘速處理。感謝您的理解。