OpenAI首個能「圖像思考」模型！　視覺訊息直接整合進推理鏈

▲OpenAI公布最新o3推理模型。（資料照／路透）

記者王致凱／綜合報導

Open AI美國時間16日公布最新人工智慧模型「o3」，據稱該模型是首次能夠「用圖像思考」的人工智慧模型，意味著它可以理解並分析用戶上傳的草圖或者圖表，即使這些圖像的品質不高，o3模型也能思考其答案。

根據CNBC報導，OpenAI此次發表的主要新推理模型o3，同時還發表了名為「o4-mini」的較小型模型，是自去年9月推出o1模型後，再次推出推理模型，並稱該模型專注於解決複雜問題，並且可以透過多個步驟來思考答案。

OpenAI表示，使用o3模型，用戶可以上傳白板筆記、草圖或其他影像，讓人工智慧進行分析與討論。該模型還可以旋轉、縮放或使用其他圖像編輯工具。Open指出，這是推理模型首次能夠獨立使用所有ChatGPT工具，如網頁瀏覽、Python、圖像理解和圖像生成等，有助於更有效解決複雜問題，並且朝著獨立行動邁進。

OpenAI說，o3模型專門針對數學、編碼、科學和理解圖像進行調整，而o4-mini模型則運行速度更快。OpenAI表示，o3 和 o4-mini模型是首個能夠「用圖像思考」的人工智慧模型，這代表它們不僅能看到圖像，還能直接將視覺訊息整合到推理鏈之中。

OpenAI自2022年底推出ChatGPT聊天機器人以來，該公司一直快速升級其人工智慧模型，使其工作範圍不僅能生成文本，還能生成圖像、語音或影像。目前，該公司於人工智慧領域保持領先地位，但面臨來自谷歌等競爭對手的挑戰。

標題：OpenAI首個能「圖像思考」模型！　視覺訊息直接整合進推理鏈

聲明：本文版權屬原作者。轉載內容僅供資訊傳遞，不涉及任何投資建議。如有侵權，請立即告知，我們將儘速處理。感謝您的理解。

OpenAI首個能「圖像思考」模型！　視覺訊息直接整合進推理鏈

相關文章：

Related Posts:

相關文章：

Related Posts:

相關文章

把握兩大原則 波動中仍有多方收益機會

銅板小喫狂漲！ 「1國民美食」被一票人拒喫：寧願買便當

新台幣連4貶收32.608元 單週仍漲9.7分

把握兩大原則波動中仍有多方收益機會

銅板小喫狂漲！　「1國民美食」被一票人拒喫：寧願買便當

新台幣連4貶收32.608元單週仍漲9.7分