每日經濟新聞 2023-09-26 06:31:25
每經編輯 杜宇
據OpenAI官網9月25日消息,OpenAI宣布在接下來的兩周內,將在ChatGPT中向Plus和Enterprise用戶推出語音和圖像。語音將在iOS和Android上推出(在您的設置中選擇加入),圖像將在所有平臺上提供。
圖片來源:OpenAI官網
語音輸入功能類似于手機上的語音助手,用戶只需按下一個按鈕,說出自己的問題,ChatGPT 就會將其轉換為文本,然后生成答案,再將答案轉換為語音,播放給用戶。
例如,讓ChatGPT聽一段小貓咪的文本故事,然后選擇人類語音便可以一鍵完成轉錄。完成后,用戶可以下載這段語音。
OpenAI稱,這項新的語音技術能夠從幾秒鐘的真實語音中制作出逼真的合成語音,為許多有創意和無障礙的應用打開了大門。然而,這些功能也帶來了新的風險,例如惡意行為者可能冒充公眾人物或實施欺詐。OpenAI 表示,這種模型不會被廣泛開放,而是會受到嚴格的控制和限制。
圖像輸入功能則類似于 Google Lens,用戶可以拍攝自己感興趣的事物,并上傳到 ChatGPT 中。ChatGPT會嘗試識別用戶想要詢問的內容,并給出相應的回答。用戶還可以用應用中的繪圖工具來幫助表達自己的問題,或者配合語音或文本輸入來進行交流。
用戶可以向ChatGPT展示一張或多張圖片,提問相關的問題。例如,發送一張壞掉的燒烤爐圖片,然后詢問無法啟動原因;拍攝一張冰箱中的食材,詢問多種菜品制作方案。
帶視覺的GPT-4(GPT-4V)使用戶能夠指示GPT-4分析用戶提供的圖像輸入,OpenAI稱,這是我們廣泛提供的最新功能。將額外的模態(如圖像輸入)納入大型語言模型(LLM)被一些人視為人工智能研究和開發的關鍵前沿。多模式LLM提供了一種可能性,即通過新穎的接口和功能擴大純語言系統的影響,使其能夠解決新任務,并為用戶提供新穎的體驗。在該系統卡中,我們分析了GPT-4V的安全特性。我們在GPT-4V安全方面的工作建立在GPT-4的基礎上,在這里我們深入研究了專門針對圖像輸入所做的評估、準備和緩解工作。
基于視覺的模型也帶來了新的挑戰,從對人的幻覺到在高風險領域依賴模型對圖像的解釋。在進行更廣泛的部署之前,我們與紅色團隊成員一起測試了該模型在極端主義和科學熟練度等領域的風險,以及一組不同的阿爾法測試人員。我們的研究使我們能夠在幾個關鍵細節上保持一致,以便負責任地使用。
OpenAI還放出了一段視頻,是和ChatGPT商量著修自行車,不斷問 ChatGPT:這里是扳手嗎?是調整這里嗎?甚至還把說明書拍照發給ChatGPT求解釋。
圖片來源:OpenAI官網
OpenAI表示還采取了技術措施,大幅限制了ChatGPT分析和直接陳述他人的能力,因為ChatGPT并不總是準確的,這些系統應該尊重個人隱私。
據中國基金報,國盛證券分析稱,Chatgpt即將開放圖生文及語音對話功能,AI技術持續迭代再翻新一頁。
二級市場上,近期AI板塊的走強,離不開行業利好的刺激。
7月13日,網信辦等七部門聯合公布《生成式人工智能服務管理暫行辦法》。8月31日起,百度文心一言、訊飛星火等大模型正式向公眾開放。9月5日,WPS AI正式面向社會開放,率先應用在WPS智能文檔。
9月21日,微軟舉行了秋季發布會,在發布會上微軟宣布將于本月26日發布Windows 11的下一個大更新23H2,據介紹本次系統更新將會有超過150項新功能,包括新的人工智能驅動的Windows Copilot功能。
國盛證券認為,Copilot發布進度超預期,AI辦公的擴展速度及價值空間均遠超預期。同時,國內AIGC監管已走上正軌、軟件應用價值亟待釋放。
天風證券表示,看好光模塊為AI最強板塊:光模塊板塊基本面一直以來利好不斷。2024年800G預期大規模放量至千萬只級別,海外、國內400G需求不斷上調至800G同等規模。2025年800G需求持續且1.6T時代開啟,光模塊景氣持續3年,供應格局沒有變化。
每日經濟新聞綜合OpenAI官網、中國基金報、市場公開消息
封面圖片來源:視覺中國-VCG111421680440
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP